\chapter{内积空间}





%%%%%%%%%%%%%%%%%%%%%%%%%%%%%--------------------内积空间的概念

\section{内积空间的概念}

在解析几何中,我们已经知道, \({\mathbb{R}}^{3}\) 中任一向量可定义其 “长度”,空间中任意两点之间可定义其距离. 向量 \(\mathbf{v} = \left( {{x}_{1},{x}_{2},{x}_{3}}\right)\) 的长度为

\[
\parallel \mathbf{v}\parallel = \sqrt{{x}_{1}^{2} + {x}_{2}^{2} + {x}_{3}^{2}}
\]

两点 \(\left( {{x}_{1},{x}_{2},{x}_{3}}\right) ,\left( {{y}_{1},{y}_{2},{y}_{3}}\right)\) 之间的距离为

\[
\sqrt{{\left( {x}_{1} - {y}_{1}\right) }^{2} + {\left( {x}_{2} - {y}_{2}\right) }^{2} + {\left( {x}_{3} - {y}_{3}\right) }^{2}}
\]

即这两点所代表的向量之差的长度.



我们现在要把 “长度”、“距离” 的概念推广到一般的实线性空间与复线性空间上去. 距离可看成是长度的派生概念, 而长度又可看成是内积的派生概念. 我们已经知道在 \({\mathbb{R}}^{3}\) 中,内积是这样定义的: 若 \(\mathbf{u} = \left( {{x}_{1},{x}_{2},{x}_{3}}\right) ,\mathbf{v} = \left( {{y}_{1},{y}_{2},{y}_{3}}\right)\) ,则 \(\mathbf{u}\) 与 \(\mathbf{v}\) 的内积 (或点积) 为
\[
\mathbf{u} \cdot \mathbf{v} = {x}_{1}{y}_{1} + {x}_{2}{y}_{2} + {x}_{3}{y}_{3}
\]
从而 \(\mathbf{u}\) 的长度为
\[
\parallel \mathbf{u}\parallel = {\left( \mathbf{u} \cdot \mathbf{u}\right) }^{\frac{1}{2}}
\]



\begin{property}
    \({\mathbb{R}}^{3}\) 中的内积有下列性质.
    \begin{enumerate}[(1)]
        \item \(u \cdot v = v \cdot u\);
        \item \(\left( {u + w}\right) \cdot v = u \cdot v + w \cdot v\);
        \item \(\left( {cu}\right) \cdot v = c\left( {u \cdot v}\right)\);
        \item \(u \cdot u \geq 0\) ,且 \(u \cdot u = 0\) 当且仅当 \(u = \mathbf{0}\) ,
    \end{enumerate}
其中 \(u,v,w\) 是 \({\mathbb{R}}^{3}\) 中的任意向量, \(c\) 是任一实数.
\end{property}


根据上述 4 条性质, 我们类似地定义一般线性空间上的内积.


\begin{definition}
    设 \(V\) 是实数域上的线性空间,若存在某种规则,使对 \(V\) 中任意一组有序向量 \(\{ \alpha,\beta\}\) ,都唯一地对应一个实数,记为 \(\left( {\alpha,\beta}\right)\) ,且适合如下规则:
    \begin{enumerate}[(1)]
        \item \(\left( {\beta,\alpha}\right) = \left( {\alpha,\beta}\right)\) ;
        \item \(\left( {\alpha + \beta,\mathbf{\gamma }}\right) = \left( {\alpha,\mathbf{\gamma }}\right) + \left( {\beta,\mathbf{\gamma }}\right)\) ;
        \item \(\left( {c\alpha,\beta}\right) = c\left( {\alpha,\beta}\right) ,c\) 为任一实数;
        \item \(\left( {\alpha,\alpha}\right) \geq 0\) 且等号成立当且仅当 \(\alpha = \mathbf{0}\) ,
    \end{enumerate}
    则称在 \(V\) 上定义了一个内积. 实数 \(\left( {\alpha,\beta}\right)\) 称为 \(\alpha\) 与 \(\beta\) 的内积. 线性空间 \(V\) 称为实内积空间. 有限维实内积空间称为 Euclid 空间, 简称为欧氏空间.
\end{definition}



对复数域上的线性空间, 我们也可以定义内积.

\begin{definition}
    设 \(V\) 是复数域上的线性空间,若存在某种规则,使对 \(V\) 中任意一组有序向量 \(\{ \alpha,\beta\}\) ,都唯一地对应一个复数,记为 \(\left( {\alpha,\beta}\right)\) ,且适合如下规则:
    \begin{enumerate}[(1)]
        \item \(\left( {\beta,\alpha}\right) = \overline{\left( \alpha,\beta\right) }\) ;
        \item \(\left( {\alpha + \beta,\mathbf{\gamma }}\right) = \left( {\alpha,\mathbf{\gamma }}\right) + \left( {\beta,\mathbf{\gamma }}\right)\);
        \item \(\left( {c\alpha,\beta}\right) = c\left( {\alpha,\beta}\right) ,c\) 为任一复数;
        \item  \(\left( {\alpha,\alpha}\right) \geq 0\) 且等号成立当且仅当 \(\alpha = \mathbf{0}\) ,
    \end{enumerate}
则称在 \(V\) 上定义了一个内积. 复数 \(\left( {\alpha,\beta}\right)\) 称为 \(\alpha\) 与 \(\beta\) 的内积. 线性空间 \(V\) 称为复内积空间. 有限维复内积空间称为酉空间.
\end{definition}


\begin{note}
    \begin{enumerate}[(1)]
        \item 对于复内积空间,由共轭对称性可知,$ (\alpha,\alpha)\in \mathbb{R}$,于是复内积空间的第(4)条有意义;
        \item 对于实内积空间,第二变元仍为线性.对于复内积空间,第二变元为共轭线性,即 
        \[ (\gamma,c\alpha+d\beta) = \overline{c}(\gamma,\alpha)+\overline{d}(\gamma,\beta) .\]
    \end{enumerate}
\end{note}


\begin{example}
    设 \({\mathbb{R}}_{n}\) 是 \(n\) 维实列向量空间, \(\alpha = {\left( {x}_{1},{x}_{2},\cdots ,{x}_{n}\right) }^{\prime },\beta = \left( {{y}_{1},{y}_{2}}\right.\) , \({\left. \cdots ,{y}_{n}\right) }^{\prime }\) ,定义

\[
\left( {\alpha,\beta}\right) = {x}_{1}{y}_{1} + {x}_{2}{y}_{2} + \cdots + {x}_{n}{y}_{n}
\]

则我们定义了一个内积,这个内积称为 \({\mathbb{R}}_{n}\) 中的标准内积.
\end{example}

\begin{definition}
    设 \({\mathbb{C}}_{n}\) 是 \(n\) 维复列向量空间, \(\alpha = {\left( {x}_{1},{x}_{2},\cdots ,{x}_{n}\right) }^{\prime },\beta = \left( {{y}_{1},{y}_{2}}\right.\) , \({\left. \cdots ,{y}_{n}\right) }^{\prime }\) ,定义

\[
\left( {\alpha,\beta}\right) = {x}_{1}{\bar{y}}_{1} + {x}_{2}{\bar{y}}_{2} + \cdots + {x}_{n}{\bar{y}}_{n}
\]

则在此定义下 \({\mathbb{C}}_{n}\) 成为一个酉空间,上述内积称为 \({\mathbb{C}}_{n}\) 的标准内积.
\end{definition}


\begin{definition}
    设 \(V = {\mathbb{R}}^{2}\) 为二维实行向量空间,若 \(\alpha = \left( {{x}_{1},{x}_{2}}\right) ,\beta = \left( {{y}_{1},{y}_{2}}\right)\) ,定义
\[
\left( {\alpha,\beta}\right) = {x}_{1}{y}_{1} - {x}_{2}{y}_{1} - {x}_{1}{y}_{2} + 4{x}_{2}{y}_{2}
\]
内积定义中的 \(\left( 1\right) ,\left( 2\right) ,\left( 3\right)\) 都成立. 当 \(\beta = \alpha\) 时,上式为
\[
\left( {\alpha,\alpha}\right) = {x}_{1}^{2} - 2{x}_{1}{x}_{2} + 4{x}_{2}^{2} = {\left( {x}_{1} - {x}_{2}\right) }^{2} + 3{x}_{2}^{2}\geq 0.
\]
(4) 也成立. 因此, \({\mathbb{R}}^{2}\) 在此内积下成为二维欧氏空间.
\end{definition}

\begin{example}
    设 \(V\) 是 \(\left\lbrack {a,b}\right\rbrack\) 区间上连续函数全体构成的实线性空间,设 \(f\left( t\right) ,g\left( t\right) \in\) \(V\) ,定义

\[
\left( {f,g}\right) = {\int }_{a}^{b}f\left( t\right) g\left( t\right) \mathrm{d}t
\]

则不难验证这是一个内积,于是 \(V\) 成为内积空间. 这是一个无限维实内积空间.
\end{example}





\begin{example}
    设 \(V\) 是 \(n\) 维实列向量空间, \(G\) 是 \(n\) 阶正定实对称阵,对 \(\alpha,\beta \in V\) , 定义

\[
\left( {\alpha,\beta}\right) = {\alpha}^{\prime }G\beta
\]

我们来证明 \(V\) 在上式的定义下成为欧氏空间. 定义 9.1.1 中的 \(\left( 2\right) ,\left( 3\right)\) 显然成立. 对 (1),注意到 \({\alpha}^{\prime }G\beta\) 是实数,其转置仍是它自己,而 \(G\) 是对称阵,故

\[
\left( {\alpha,\beta}\right) = {\alpha}^{\prime }G\beta = {\left( {\alpha}^{\prime }G\beta\right) }^{\prime } = {\beta}^{\prime }{G}^{\prime }\alpha = {\beta}^{\prime }G\alpha = \left( {\beta,\alpha}\right) .
\]

又从 \(G\) 是正定阵即可知道 (4) 成立.
\end{example}



\begin{example}
    设$ V = \mathbb{R}[x]$,$ f(x),g(x)\in  V$,
    \[ f(x) = a_0+a_1x+a_2x^2+\cdots +a_nx^n, g(x) = b_0+b_1x+b_2x^2+\cdots +b_mx^m (n\geq m),\]
    则 
    \[ (f(x),g(x)) = a_0b_0+a_1b_1+a_2b_2+\cdots +a_mb_m. \]
\end{example}




\begin{example}
    设$ V = \mathcal{M}_n(\mathbb{R})$,$ A,B \in V $,则 
    \[ (A,B) = \mathrm{tr}(AB'). \]
\end{example}



有了内积的概念, 我们便可定义向量的长度 (或称范数) 了.

\begin{definition}[范数]
    设 \(V\) 是内积空间 (实或复), \(\alpha\) 是 \(V\) 中的向量,定义 \(\alpha\) 的长度 (或范数) 为

\[
\parallel \alpha\parallel = {\left( \alpha,\alpha\right) }^{\frac{1}{2}}
\]

即实数 \(\left( {\alpha,\alpha}\right)\) 的算术根.
\end{definition}




当 \(V\) 是复内积空间时,由于\(\left( {\alpha,\alpha}\right)\) 总是实数. 从长度的定义知, \(\parallel \alpha\parallel = 0\) 当且仅当 \(\alpha = \mathbf{0}\) . 当 \(V = {\mathbb{R}}^{n}\) 且内积为标准内积时, 若 \(\alpha = \left( {{x}_{1},{x}_{2},\cdots ,{x}_{n}}\right)\) ,则
\[
\parallel \alpha\parallel = \sqrt{{x}_{1}^{2} + {x}_{2}^{2} + \cdots + {x}_{n}^{2}}
\]
利用范数可定义内积空间中两个向量的距离. 设 \(\alpha,\beta \in V\) ,定义 \(\alpha\) 与 \(\beta\) 的距离为
\[
d\left( {\alpha,\beta}\right) = \parallel \alpha - \beta\parallel
\]
显然 \(d\left( {\alpha,\beta}\right) = d\left( {\beta,\alpha}\right)\) .



\begin{theorem}
    设 \(V\) 是实或复的内积空间, \(\alpha,\beta \in V,c\) 是任一常数 (实数或复数), 则
    \begin{enumerate}[(1)]
        \item \(\parallel c\alpha\parallel = \left| c\right| \parallel \alpha\parallel\);
        \item \(\left| \left( {\alpha,\beta}\right) \right| \leq \parallel \alpha\parallel \cdot \parallel \beta\parallel\);
        \item \(\parallel \alpha + \beta\parallel \leq \parallel \alpha\parallel + \parallel \beta\parallel\) .
    \end{enumerate}
\end{theorem}
\begin{proof}
    \begin{enumerate}[(1)]
        \item \(\parallel c\alpha{\parallel }^{2} = \left( {c\alpha,c\alpha}\right) = c\bar{c}\parallel \alpha{\parallel }^{2} = {\left| c\right| }^{2}\parallel \alpha{\parallel }^{2}\) ,故 \(\parallel c\alpha\parallel = \left| c\right| \parallel \alpha\parallel\) .
        \item 若 \(\alpha = \mathbf{0}\) ,则 \(\left( {\mathbf{0},\beta}\right) = \left( {\mathbf{0} + \mathbf{0},\beta}\right) = 2\left( {\mathbf{0},\beta}\right)\) ,故 \(\left( {\mathbf{0},\beta}\right) = 0\) . 因此 (2) 成立. 若 \(\alpha \neq \mathbf{0}\) ,令

        \[
        v = \beta - \frac{\left( \beta,\alpha\right) }{\parallel \alpha{\parallel }^{2}}\alpha
        \]
        则 \(\left( {v,\alpha}\right) = 0\) ,且
        
        \[
        0 \leq \parallel v{\parallel }^{2} = \left( {\beta - \frac{\left( \beta,\alpha\right) }{\parallel \alpha{\parallel }^{2}}\alpha,\beta - \frac{\left( \beta,\alpha\right) }{\parallel \alpha{\parallel }^{2}}\alpha}\right)
        \]
        
        \[
        = \left( {\beta,\beta}\right) - \frac{\left( \beta,\alpha\right) }{\parallel \alpha{\parallel }^{2}}\left( {\alpha,\beta}\right)
        \]
        
        \[
        = \parallel \beta{\parallel }^{2} - \frac{{\left| \left( \alpha,\beta\right) \right| }^{2}}{\parallel \alpha{\parallel }^{2}}
        \]
        
        由此即可得 (2).当$ v=0$即$ \alpha,\beta$线性相关时,等号成立.
        \item 我们有
         \begin{align*}
            \parallel \alpha + \beta{\parallel }^{2} &= \left( {\alpha + \beta,\alpha + \beta}\right)\\
            &        = {\begin{Vmatrix}\alpha\end{Vmatrix}}^{2} + \left( {\alpha,\beta}\right) + \left( {\beta,\alpha}\right) + {\begin{Vmatrix}\beta\end{Vmatrix}}^{2}\\
            &        = \parallel \alpha{\parallel }^{2} + \parallel \beta{\parallel }^{2} + \left( {\alpha,\beta}\right) + \overline{\left( \alpha,\beta\right) }.
        \end{align*}
        由 (2) 得
        \[
        \left| \left( {\alpha,\beta}\right) \right| \leq \parallel \alpha\parallel \parallel \beta\parallel ,\left| \overline{\left( \alpha,\beta\right) }\right| \leq \parallel \alpha\parallel \parallel \beta\parallel
        \]
        故
        \[
        \parallel \alpha + \beta{\parallel }^{2} \leq \parallel \alpha{\parallel }^{2} + \parallel \beta{\parallel }^{2} + 2\parallel \alpha\parallel \parallel \beta\parallel = {\left( \parallel \alpha\parallel + \parallel \beta\parallel \right) }^{2}.
        \]
    \end{enumerate}
\end{proof}

\begin{remark}
    上述定理中的 (2) 通常称为 Cauchy-Schwarz 不等式, (3) 通常称为三角不等式. 
\end{remark}


\begin{example}
    $ V = \mathbb{R}^n$,取标准内积,$ \forall x,y\in \mathbb{R}$,则有 
    \[ (x_1y_1+x_2y_2+ \cdots+x_ny_n)^2\leq (x_1^2+x_2^2+\cdots+x_n^2)(y_1^2+y_2^2+\cdots+y_n^2), \]
    由 Cauchy-Schwarz 不等式即可得到,称为 Cauchy 不等式.

    $ V = C[a,b]$,取积分内积,由 Cauchy-Schwarz 不等式得到 
    \[ \left(\int_a^b f(t)g(t)dt\right)^2\leq \left(\int_a^b f(t)^2dt\right)\left(\int_a^b g(t)^2dt\right), \]
    称为Schwarz 不等式.
\end{example}




\begin{definition}
    当 \(V\) 是实内积空间时,定义非零向量 \(\alpha,\beta\) 的夹角 \(\theta\) 之余弦为
\[
\cos \theta = \frac{\left( \alpha,\beta\right) }{\parallel \alpha\parallel \parallel \beta\parallel }
\]
当 \(V\) 是复内积空间时,定义非零向量 \(\alpha,\beta\) 的夹角 \(\theta\) 之余弦为
\[
\cos \theta = \frac{\left| \left( \alpha,\beta\right) \right| }{\parallel \alpha\parallel \parallel \beta\parallel }
\]
\end{definition}



\begin{definition}
    内积空间中两个向量 \(\alpha,\beta\) 若适合 \(\left( {\alpha,\beta}\right) = 0\) ,则称 \(\alpha\) 与 \(\beta\) 垂直或正交,我们用记号 \(\alpha \bot \beta\) 来表示. 显然,零向量和任何向量都正交; 若 \(\alpha\) 与 \(\beta\) 正交,则 \(\beta\) 与 \(\alpha\) 也正交; 两个非零向量 \(\alpha,\beta\) 正交时夹角为 \({90}^{ \circ }\) .
\end{definition}


\begin{theorem}[勾股定理]
    若 \(\alpha\) 与 \(\beta\) 正交,则
    \[
\parallel \alpha + \beta{\parallel }^{2} = \parallel \alpha{\parallel }^{2} + \parallel \beta{\parallel }^{2}.
\]
\end{theorem}
\begin{proof}
    \begin{align*}
        \parallel \alpha + \beta{\parallel }^{2}&=(\alpha+\beta,\alpha+\beta)\\
        &=\parallel \alpha{\parallel }^{2} + \parallel \beta{\parallel }^{2}+(\alpha,\beta)+(\beta,\alpha)\\
        & =\parallel \alpha{\parallel }^{2} + \parallel \beta{\parallel }^{2}.
    \end{align*}
\end{proof}




%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%---------------------内积的表示和正交基
\section{内积的表示和正交基}

这一节我们将只考虑有限维内积空间. 我们要讨论的第一个问题是: 给定内积空间的一组基以后,如何用坐标向量来表示向量的内积. 具体来说,设 \(V\) 是欧氏空间 (酉空间), \(\left\{ {{v}_{1},{v}_{2},\cdots ,{v}_{n}}\right\}\) 是 \(V\) 的一组基. 如果 \(\left( {{v}_{i},{v}_{j}}\right) = {g}_{ij}(i,j =\) \(1,2,\cdots ,n),\alpha = {a}_{1}{v}_{1} + {a}_{2}{v}_{2} + \cdots + {a}_{n}{v}_{n},\beta = {b}_{1}{v}_{1} + {b}_{2}{v}_{2} + \cdots + {b}_{n}{v}_{n}\) ,问: \(\left( {\alpha,\beta}\right)\) 等于什么?

用向量内积的性质,很容易给出这个问题的答案. 当 \(V\) 是欧氏空间时,

\[
\left( {\alpha,\beta}\right) = \left( {\mathop{\sum }\limits_{{i = 1}}^{n}{a}_{i}{v}_{i},\mathop{\sum }\limits_{{j = 1}}^{n}{b}_{j}{v}_{j}}\right) = \mathop{\sum }\limits_{{i,j = 1}}^{n}{a}_{i}{g}_{ij}{b}_{j}.
\]

我们把上述结论写成矩阵形式:

\[
\left( {\alpha,\beta}\right) = \left( {{a}_{1},{a}_{2},\cdots ,{a}_{n}}\right) \left( \begin{matrix} {g}_{11} & {g}_{12} & \cdots & {g}_{1n} \\ {g}_{21} & {g}_{22} & \cdots & {g}_{2n} \\ \vdots & \vdots & & \vdots \\ {g}_{n1} & {g}_{n2} & \cdots & {g}_{nn} \end{matrix}\right) \left( \begin{matrix} {b}_{1} \\ {b}_{2} \\ \vdots \\ {b}_{n} \end{matrix}\right) ,
\]

其中矩阵

\[
\mathbf{G} = \left( \begin{matrix} {g}_{11} & {g}_{12} & \cdots & {g}_{1n} \\ {g}_{21} & {g}_{22} & \cdots & {g}_{2n} \\ \vdots & \vdots & & \vdots \\ {g}_{n1} & {g}_{n2} & \cdots & {g}_{nn} \end{matrix}\right) = \left( \begin{matrix} \left( {{v}_{1},{v}_{1}}\right) & \left( {{v}_{1},{v}_{2}}\right) & \cdots & \left( {{v}_{1},{v}_{n}}\right) \\ \left( {{v}_{2},{v}_{1}}\right) & \left( {{v}_{2},{v}_{2}}\right) & \cdots & \left( {{v}_{2},{v}_{n}}\right) \\ \vdots & \vdots & & \vdots \\ \left( {{v}_{n},{v}_{1}}\right) & \left( {{v}_{n},{v}_{2}}\right) & \cdots & \left( {{v}_{n},{v}_{n}}\right) \end{matrix}\right)
\]
称为基向量 \(\left\{ {{v}_{1},{v}_{2},\cdots ,{v}_{n}}\right\}\) 的 Gram (格列姆) 矩阵或内积空间 \(V\) 在给定基下的度量矩阵.

于是, 我们得到了内积在给定基下的表示:

\[
\left( {\alpha,\beta}\right) = {x}^{\prime }\mathbf{G}y
\]


其中 \(x,y\) 分别是向量 \(\alpha,\beta\) 在给定基下的坐标向量.

再来看矩阵 \(\mathbf{G}\) . 因为 \(\left( {{v}_{i},{v}_{j}}\right) = \left( {{v}_{j},{v}_{i}}\right)\) ,所以 \(\mathbf{G}\) 是实对称阵. 又因为对任意的非零向量 \(\alpha\) ,总有 \(\left( {\alpha,\alpha}\right) > 0\) ,所以 \({x}^{\prime }\mathbf{G}x > 0\) 对一切 \(n\) 维非零实列向量 \(x\) 成立. 这表明 \(\mathbf{G}\) 是一个正定阵. 反之,给定 \(n\) 阶正定实对称阵,利用上 式,我们也可以定义 \(V\) 上的内积 为$ (\alpha,\beta) = x'Gy$,$ x,y$分别为$ \alpha,\beta$在基$ v_1,v_2,\cdots,v_n$下的坐标向量. 由此我们可以看出,若给定了 \(n\) 维欧氏空间的一组基,则欧氏空间上的内积和 \(n\) 阶正定实对称阵之间存在着一个一一对应.



设 \(V\) 是酉空间,我们类似可证若 \(\alpha = {a}_{1}{v}_{1} + {a}_{2}{v}_{2} + \cdots + {a}_{n}{v}_{n},\beta = {b}_{1}{v}_{1} +\) \({b}_{2}{v}_{2} + \cdots + {b}_{n}{v}_{n}\) ,令
\[
\mathbf{H} = \left( \begin{matrix} \left( {{v}_{1},{v}_{1}}\right) & \left( {{v}_{1},{v}_{2}}\right) & \cdots & \left( {{v}_{1},{v}_{n}}\right) \\ \left( {{v}_{2},{v}_{1}}\right) & \left( {{v}_{2},{v}_{2}}\right) & \cdots & \left( {{v}_{2},{v}_{n}}\right) \\ \vdots & \vdots & & \vdots \\ \left( {{v}_{n},{v}_{1}}\right) & \left( {{v}_{n},{v}_{2}}\right) & \cdots & \left( {{v}_{n},{v}_{n}}\right) \end{matrix}\right)
\]
则
\[
\left( {\alpha,\beta}\right) = {x}^{\prime }\mathbf{H}\overline{y}
\]
其中 \(x,y\) 分别是 \(\alpha,\beta\) 的坐标向量, \(\mathbf{H}\) 是一个正定 Hermite 矩阵.


由前面的两个内积的矩阵表示,我们自然地会提出这样一个问题: 在 \(V\) 中是否存在这样一组基,它的 Gram 矩阵是单位阵 \({I}_{n}\) ? 如果存在,那么在这组基下的内积表示将特别简单. 

首先,我们看看如果 \(\mathbf{G} = {I}_{n}\) (或 \(\mathbf{H} = {I}_{n}\) ),基向量要满足什么条件? 显然, \(\mathbf{G}\) (或 \(\mathbf{H}\) ) 等于 \({I}_{n}\) 的充分必要条件是:
\[
\left( {{v}_{i},{v}_{j}}\right) = 0\left( {i \neq j}\right) ,\left( {{v}_{i},{v}_{i}}\right) = 1.
\]



\begin{definition}[标准正交基]
    设 \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}\) 是 \(n\) 维内积空间 \(V\) 的一组基. 若 \({e}_{i} \bot {e}_{j}\) 对一切 \(i \neq j\) 成立,则称这组基是 \(V\) 的一组正交基. 又若 \(V\) 的一组正交基中每个向量的长度等于 1 , 则称这组正交基为标准正交基.
\end{definition}


显然在标准正交基下, 度量矩阵就是单位阵, 那么在任意的有限维内积空间中,标准正交基一定存在吗? 很容易验证, \(n\) 维列 (行) 向量空间在标准内积下,它的标准基 (即标准单位向量组成的基) 是标准正交基. 在证明一般的内积空间标准正交基的存在性之前, 我们先证明正交向量组的两个重要性质.


\begin{lemma}
    内积空间 \(V\) 中的任何一组两两正交的非零向量必线性无关.
\end{lemma}
\begin{proof}
    设 \({v}_{1},{v}_{2},\cdots ,{v}_{m}\) 是 \(V\) 中两两正交的非零向量. 
\[
{k}_{1}{v}_{1} + {k}_{2}{v}_{2} + \cdots + {k}_{m}{v}_{m} = \mathbf{0},
\]
则对任一 \(1 \leq i \leq m\) ,有
\[
\left( {{k}_{1}{v}_{1} + {k}_{2}{v}_{2} + \cdots + {k}_{m}{v}_{m},{v}_{i}}\right) = 0.
\]
但 \({v}_{i} \bot {v}_{j}\left( {i \neq j}\right)\) ,故由上式可得
\[
{k}_{i}\left( {{v}_{i},{v}_{i}}\right) = 0
\]
由于 \({v}_{i} \neq \mathbf{0}\) ,故 \({k}_{i} = 0\) .
\end{proof}

\begin{corollary}
    $ n$维内积空间$ V$中两两正交的非零向量至多有$ n$个.
\end{corollary}
\begin{proof}
    设$ V$中有$ m$个$ (m>n)$个两两正交的非零向量,由上述引理知这$ m$个向量必线性无关.但$\dim V = n$,知超过$n $个的向量组必线性相关,从而结论成立.
\end{proof}



\begin{lemma}
    若向量 \(\alpha\) 和向量 \({\beta}_{1},{\beta}_{2},\cdots ,{\beta}_{k}\) 中每个向量正交,则 \(\alpha\) 和由向量 \({\beta}_{1},{\beta}_{2},\cdots ,{\beta}_{k}\) 生成的子空间中每个向量正交,即$ \alpha$与$ L(\beta_1, \beta_2, \cdots , \beta_k)$正交.
\end{lemma}
\begin{proof}
    设 \(\beta = {b}_{1}{\beta}_{1} + {b}_{2}{\beta}_{2} + \cdots + {b}_{k}{\beta}_{k}\) ,则
\[
\left( {\beta,\alpha}\right) = \left( {{b}_{1}{\beta}_{1} + {b}_{2}{\beta}_{2} + \cdots + {b}_{k}{\beta}_{k},\alpha}\right) = \mathop{\sum }\limits_{{i = 1}}^{k}{b}_{i}\left( {{\beta}_{i},\alpha}\right) = 0.
\]
故结论成立.
\end{proof}

\begin{remark}
    即$ \forall \gamma \in L(\beta_1, \beta_2, \cdots , \beta_k)$,都有$ (\gamma,\alpha) = 0$.
\end{remark}



若 \(\alpha\) 是一个非零向量,则 \(\frac{1}{\parallel \alpha \parallel }\alpha\) 是一个长度等于 1 的向量,这个过程称为单位化. 因此要证明存在标准正交基, 我们只须先证明存在正交基, 然后将正交基单位化即可. 我们从一组线性无关的向量出发, 设法构造出一组正交向量来. 设 \({u}_{1},{u}_{2},\cdots ,{u}_{m}\) 是 \(V\) 中 \(m\) 个线性无关的向量. 我们采用数学归纳法. 当只有一个向量时,令 \({v}_{1} = {u}_{1}\) . 假定 \({v}_{1},{v}_{2},\cdots ,{v}_{k}\) 已经构造好,是一组两两正交的非零向量. 我们用待定系数法求 \({v}_{k + 1}\) . 设
\[
{v}_{k + 1} = {u}_{k + 1} + {a}_{1}{v}_{1} + {a}_{2}{v}_{2} + \cdots + {a}_{k}{v}_{k}
\]
两边和 \({v}_{j}\left( {j \leq k}\right)\) 作内积,便得到
\[
0 = \left( {{v}_{k + 1},{v}_{j}}\right) = \left( {{u}_{k + 1},{v}_{j}}\right) + {a}_{j}\left( {{v}_{j},{v}_{j}}\right)
\]
于是
\[
{a}_{j} = - \frac{\left( {u}_{k + 1},{v}_{j}\right) }{\left( {v}_{j},{v}_{j}\right) }.
\]
下面我们给出定理及其证明.




\begin{theorem}
    设 \(V\) 是内积空间, \({u}_{1},{u}_{2},\cdots ,{u}_{m}\) 是 \(V\) 中 \(m\) 个线性无关的向量,则在 \(V\) 中存在 \(m\) 个两两正交的非零向量 \({v}_{1},{v}_{2},\cdots ,{v}_{m}\) ,使 \({v}_{1},{v}_{2},\cdots ,{v}_{m}\) 张成的 \(V\) 的子空间恰好为由 \({u}_{1},{u}_{2},\cdots ,{u}_{m}\) 张成的 \(V\) 的子空间,即 \({v}_{1},{v}_{2},\cdots ,{v}_{m}\) 是该子空间的一组正交基.
\end{theorem}
\begin{proof}
    设 \({v}_{1} = {u}_{1}\) ,其余 \({v}_{i}\) 可用数学归纳法定义如下: 假定 \({v}_{k}\) 已定义好 \(\left( {1 \leq k < m}\right)\) ,这时 \({v}_{i}\left( {1 \leq i \leq k}\right)\) 两两正交非零且 \({v}_{i}\left( {1 \leq i \leq k}\right)\) 皆属于由 \({u}_{1},{u}_{2},\cdots ,{u}_{k}\) 张成的子空间. 令

    \[
    {v}_{k + 1} = {u}_{k + 1} - \mathop{\sum }\limits_{{j = 1}}^{k}\frac{\left( {u}_{k + 1},{v}_{j}\right) }{{\begin{Vmatrix}{v}_{j}\end{Vmatrix}}^{2}}{v}_{j}
    \]
    
    注意 \({v}_{k + 1} \neq \mathbf{0}\) ,否则 \({u}_{k + 1}\) 将是 \({v}_{1},{v}_{2},\cdots ,{v}_{k}\) 的线性组合,从而也是 \({u}_{1},{u}_{2},\cdots ,{u}_{k}\) 的线性组合,此与 \({u}_{1},{u}_{2},\cdots ,{u}_{m}\) 线性无关矛盾. 又对任意的 \(1 \leq i \leq k\) ,有
    
    \[
    \left( {{v}_{k + 1},{v}_{i}}\right) = \left( {{u}_{k + 1},{v}_{i}}\right) - \mathop{\sum }\limits_{{j = 1}}^{k}\frac{\left( {u}_{k + 1},{v}_{j}\right) }{{\begin{Vmatrix}{v}_{j}\end{Vmatrix}}^{2}}\left( {{v}_{j},{v}_{i}}\right)
    \]
    
    \[
    = \left( {{u}_{k + 1},{v}_{i}}\right) - \left( {{u}_{k + 1},{v}_{i}}\right) = 0.
    \]
    
    因此 \({v}_{1},{v}_{2},\cdots ,{v}_{k + 1}\) 两两正交. 又因为 \({v}_{i}\left( {1 \leq i \leq k}\right)\) 皆属于由 \({u}_{1},{u}_{2},\cdots ,{u}_{k}\) 张成的子空间,故由 \({v}_{k + 1}\) 的定义知, \({v}_{i}\left( {1 \leq i \leq k + 1}\right)\) 皆属于由 \({u}_{1},{u}_{2},\cdots ,{u}_{k},{u}_{k + 1}\) 张成的子空间. 这就证明了结论.
\end{proof}




上述正交化过程通常称为 Gram-Schmidt (格列姆-施密特) 方法.



\begin{theorem}
    任一有限维内积空间均有标准正交基.
\end{theorem}
\begin{proof}
    任取一组基$ u_1,\cdots, u_n$,对该组基做Gram-Schmidt过程,得到一组正交基,再将其标准化,得到一组标准正交基.
\end{proof}



\begin{example}
    设 \(V\) 是三维实行向量空间,内积为标准内积. 又已知 3 个线性无关的向量:

\[
{u}_{1} = \left( {3,0,4}\right) ,{u}_{2} = \left( {-1,0,7}\right) ,{u}_{3} = \left( {2,9,{11}}\right) ,
\]
用 Gram-Schmidt 方法求 \(V\) 的一组标准正交基.
\end{example}
\begin{solution}
    令 \({v}_{1} = \left( {3,0,4}\right)\) ,

\[
{v}_{2} = \left( {-1,0,7}\right) - \frac{\left( -1 \cdot 3 + 0 + 7 \cdot 4\right) }{25}\left( {3,0,4}\right) = \left( {-4,0,3}\right) ,
\]

\begin{align*}
    {v}_{3} &= \left( {2,9,{11}}\right) - \frac{\left( 2 \cdot 3 + 0 + {11} \cdot 4\right) }{25}\left( {3,0,4}\right)\\
    &- \frac{\left( 2 \cdot \left( -4\right) + 0 + {11} \cdot 3\right) }{25}\left( {-4,0,3}\right)\\
    &= \left( {0,9,0}\right)
\end{align*}
再令
\[
{w}_{1} = \frac{1}{5}\left( {3,0,4}\right)
\]
\[
{w}_{2} = \frac{1}{5}\left( {-4,0,3}\right)
\]
\[
{w}_{3} = \left( {0,1,0}\right)
\]
则 \(\left\{ {{w}_{1},{w}_{2},{w}_{3}}\right\}\) 是 \(V\) 的一组标准正交基.
\end{solution}






\begin{lemma}
    设$ V$为内积空间,$ \{e_1,e_2,\cdots,e_n\}$,$ \{f_1, f_2,\cdots,f_n\}$为$ V$的两组基,并且从$ e$到$ f$的过渡矩阵为$ C$,即有 
    \[ (f_1,f_2,\cdots,f_n) = (e_1,e_2,\cdots,e_n)C, \]
    设$ V$分别在$ \{e_1,e_2,\cdots,e_n\}$和$ \{f_1, f_2,\cdots,f_n\}$下的Gram阵为$ G,H$.则有
    \begin{itemize}
        \item $ V$为实内积空间,
        \[ H = C'GC, \]
        \item $ V$为复内积空间,
        \[ H = C'G\overline{C}. \]
    \end{itemize}
\end{lemma}


\begin{proof}
    记$ G = (g_{ij})_{n\times n},g_{ij} = (e_i,e_j) $.
    \[ (f_1,f_2,\cdots,f_n) = (e_1,e_2,\cdots,e_n)C ,\]
    则$ f_k,f_{\ell}$分别为
    \[ f_k = \sum_{i=1}^{n}e_ic_{ik},f_{\ell} = \sum_{j=1}^{n}e_jc_{j\ell}. \]
    则$ f_k,f_{\ell}$的内积为(只证明实内积空间的情况)
    \begin{align*}
        (f_k,f_{\ell}) &= \sum_{i=1}^{n}\sum_{j=1}^{n}c_{ik}c_{j\ell}(e_i,e_j)\\
        &=\sum_{i=1}^{n}\sum_{j=1}^{n}c_{ik}c_{j\ell}g_{ij}\\
        &=\sum_{j=1}^n \left(\sum_{i=1}^n c_{ik}g_{ij}\right)c_{j\ell}
    \end{align*}
    从而$ H = C'GC.$
\end{proof}

于是给定一内积空间$V $(实内积空间)的一组基$ \{e_1,\cdots, e_n\}$,其Gram矩阵为$ G$.根据前面的讨论,$ G$一定是一个正定实对称阵.由正定矩阵的性质知存在非异阵$ C$使得$ C'GC = I_n$.

令$ (f_1, f_2,\cdots,f_n) = (e_1 ,e_2,\cdots,e_n)C$,由上面的引理可知
\[ H = C'GC = I_n ,\]
即$ \{f_1, f_2,\cdots,f_n\}$为标准正交基.




下面我们要讨论子空间的正交问题.


\begin{definition}
    设 \(U\) 是内积空间 \(V\) 的子空间. 令
\[
{U}^{ \bot } = \{ v \in V \mid \left( {v,U}\right) = 0\}
\]
这里 \(\left( {v,U}\right) = 0\) 表示对一切 \(u \in U\) ,均有 \(\left( {v,u}\right) = 0\) . 容易验证 \({U}^{ \bot }\) 是 \(V\) 的子空间,称为 \(U\) 的正交补空间.
\end{definition}

\begin{theorem}
    设 \(V\) 是 \(n\) 维内积空间, \(U\) 是 \(V\) 的子空间,则
    \begin{enumerate}[(1)]
        \item \(V = U \oplus {U}^{ \bot }\) ;
        \item \(U\) 上的任一组标准正交基均可扩张为 \(V\) 上的标准正交基.
    \end{enumerate}
\end{theorem}

\begin{proof}
    \begin{enumerate}[(1)]
        \item  设$ \dim U = m$,将$ V$上的内积限制在$ U$上,则$ U$是一个$ m$维内积空间.设存在 \(U\) 的一组标准正交基 \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{m}}\right\}\) . 对任意的 \(v \in V\) ,令

        \[
        u = \left( {v,{e}_{1}}\right) {e}_{1} + \left( {v,{e}_{2}}\right) {e}_{2} + \cdots + \left( {v,{e}_{m}}\right) {e}_{m}
        \]
        
        则 \(u \in U\) . 又令
        
        \[
        w = v - u
        \]
        
        则对任一 \({e}_{i}\left( {i = 1,2,\cdots ,m}\right)\) ,有
        \[ (w,e_i) = 0, \]
        因此 \(w \in {U}^{ \bot }\) ,而 \(v = u + w\) .

        若 \(x \in U \cap {U}^{ \bot }\) ,则 \(\left( {x,x}\right) = 0\) ,由正定性可知 \(x = \mathbf{0}\) ,即 \(U \cap {U}^{ \bot } = 0\) .

        这就证明了 \(V = U \oplus {U}^{ \bot }\) .
        \item 设 \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{m}}\right\}\) 是 \(U\) 上任一组标准正交基, \(\left\{ {{e}_{m + 1},\cdots ,{e}_{n}}\right\}\) 是 \({U}^{ \bot }\) 上任一组标准正交基,则显然 \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}\) 是 \(V\) 的一组标准正交基.
    \end{enumerate}
\end{proof}



\begin{definition}
    设 \(V\) 是 \(n\) 维内积空间, \({V}_{i}\left( {i = 1,2,\cdots ,k}\right)\) 是 \(V\) 的子空间. 如果对任意的 \(\alpha \in {V}_{i}\) 和任意的 \(\beta \in {V}_{j}\left( {j \neq i}\right)\) 均有 \(\left( {\alpha,\beta}\right) = 0\) ,则称子空间 \({V}_{i}\) 和 \({V}_{j}\) 正交. 若 \(V = {V}_{1} + {V}_{2} + \cdots + {V}_{k}\) 且 \({V}_{i}\) 两两正交,则称 \(V\) 是 \({V}_{i}\left( {i = 1,2,\cdots ,k}\right)\) 的正交和, 记为

\[
V = {V}_{1} \bot {V}_{2} \bot \cdots \bot {V}_{k}
\]
\end{definition}


\begin{lemma}
    正交和必为直和且任一 \({V}_{i}\) 和其余子空间的和正交.
\end{lemma}
\begin{proof}
    对任意的 \({v}_{i} \in {V}_{i}\) 和 \(\mathop{\sum }\limits_{{j \neq i}}{v}_{j}\left( {{v}_{j} \in {V}_{j}}\right)\) ,
\[
\left( {{v}_{i},\mathop{\sum }\limits_{{j \neq i}}{v}_{j}}\right) = \mathop{\sum }\limits_{{j \neq i}}\left( {{v}_{i},{v}_{j}}\right) = 0
\]

 任取 \(v \in {V}_{i} \cap \left( {\mathop{\sum }\limits_{{j \neq i}}{V}_{j}}\right)\) ,则由上述论证可得 \(\left( {v,v}\right) = 0\) , 故 \(v = \mathbf{0}\) (内积的正定性),从而 \({V}_{i} \cap \left( {\mathop{\sum }\limits_{{j \neq i}}{V}_{j}}\right) = 0\) ,即正交和必为直和. 因此正交和通常也称为正交直和.
\end{proof}



\begin{definition}
    设 \(V = {V}_{1} \bot {V}_{2} \bot \cdots \bot {V}_{k}\) ,定义 \(V\) 上的线性变换 \({e}_{i}(i =\) \(1,2,\cdots ,k)\) 如下: 若 \(v = {v}_{1} + \cdots + {v}_{i} + \cdots + {v}_{k}\left( {{v}_{i} \in {V}_{i}}\right)\) ,令 \({e}_{i}\left( v\right) = {v}_{i}\) . 容易验证 \({e}_{i}\) 是 \(V\) 上的线性变换且 \({e}_{i}^{2} = {e}_{i},{e}_{i}{e}_{j} = \mathbf{0}\left( {i \neq j}\right) ,{e}_{1} + {e}_{2} + \cdots + {e}_{k} = {I}_{V}\) . 线性变换 \({e}_{i}\) 称为 \(V\) 到 \({V}_{i}\) 的正交投影 (简称投影).
\end{definition}


\begin{lemma}
    设 \(U\) 是内积空间 \(V\) 的子空间, \(V = U \bot {U}^{ \bot }.e\) 是 \(V\) 到 \(U\) 的正交投影,则对任意的 \(\alpha,\beta \in V\) ,都有

\[
\left( {e\left( \alpha\right) ,\beta}\right) = \left( {\alpha,e\left( \beta\right) }\right)
\]
\end{lemma}
\begin{proof}
    设 \(\alpha = {u}_{1} + {w}_{1},\beta = {u}_{2} + {w}_{2}\) ,其中 \({u}_{1},{u}_{2} \in U,{w}_{1},{w}_{2} \in {U}^{ \bot }\) , 则 \(e\left( \alpha\right) = {u}_{1},e\left( \beta\right) = {u}_{2}\) ,所以

\[
\left( {e\left( \alpha\right) ,\beta}\right) = \left( {{u}_{1},{u}_{2} + {w}_{2}}\right) = \left( {{u}_{1},{u}_{2}}\right) + \left( {{u}_{1},{w}_{2}}\right) = \left( {{u}_{1},{u}_{2}}\right) ,
\]

\[
\left( {\alpha,e\left( \beta\right) }\right) = \left( {{u}_{1} + {w}_{1},{u}_{2}}\right) = \left( {{u}_{1},{u}_{2}}\right) + \left( {{w}_{1},{u}_{2}}\right) = \left( {{u}_{1},{u}_{2}}\right) .
\]

由此即得结论.
\end{proof}

下面的结论是 “斜边大于直角边” 这一几何命题在内积空间中的推广.

\begin{theorem}[Bessel (贝塞尔) 不等式]
    设 \({v}_{1},{v}_{2},\cdots ,{v}_{m}\) 是内积空间 \(V\) 中的正交非零向量组, \(y\) 是 \(V\) 中任一向量,则

\[
\mathop{\sum }\limits_{{k = 1}}^{m}\frac{{\left| \left( y,{v}_{k}\right) \right| }^{2}}{{\begin{Vmatrix}{v}_{k}\end{Vmatrix}}^{2}} \leq \parallel y{\parallel }^{2}
\]

等号成立的充分必要条件是: \(y\) 属于由 \(\left\{ {{v}_{1},{v}_{2},\cdots ,{v}_{m}}\right\}\) 张成的子空间.
\end{theorem}
\begin{proof}
    令

\[
x = \mathop{\sum }\limits_{{k = 1}}^{m}\frac{\left( y,{v}_{k}\right) }{{\begin{Vmatrix}{v}_{k}\end{Vmatrix}}^{2}}{v}_{k}
\]

则 \(x\) 属于由 \(\left\{ {{v}_{1},{v}_{2},\cdots ,{v}_{m}}\right\}\) 张成的子空间 \(U\) . 于是

\[
\left( {y - x,{v}_{k}}\right) = 0
\]

对一切 \(k = 1,2,\cdots ,m\) 成立,因此 \(\left( {y - x,x}\right) = 0\) . 由勾股定理得:
\[
\parallel y{\parallel }^{2} = \parallel y - x{\parallel }^{2} + \parallel x{\parallel }^{2}
\]

故

\[
\parallel x{\parallel }^{2} \leq \parallel y{\parallel }^{2}
\]

又由 \({v}_{1},{v}_{2},\cdots ,{v}_{m}\) 两两正交不难算出

\[
\parallel x{\parallel }^{2} = \mathop{\sum }\limits_{{k = 1}}^{m}\frac{{\left| \left( y,{v}_{k}\right) \right| }^{2}}{{\begin{Vmatrix}{v}_{k}\end{Vmatrix}}^{2}}
\]

若 \(y\) 属于由 \(\left\{ {{v}_{1},{v}_{2},\cdots ,{v}_{m}}\right\}\) 张成的子空间,则 \(y = x\) ,故等号成立. 反之,若等号成立,则 \(\parallel y - x{\parallel }^{2} = 0\) ,故 \(y = x\) ,即 \(y\) 属于由 \(\left\{ {{v}_{1},{v}_{2},\cdots ,{v}_{m}}\right\}\) 张成的子空间. 
\end{proof}
\begin{note}
    上述定理是说,一个向量在一组两两正交的非零向量组上投影的平方和小于等于该向量范数的平方.

    对于无限维内积空间也成立.
\end{note}


%%%%%%%%%%%%%%%%%%%%%%%伴随

\section{伴随}

在这一节里我们将考察内积空间中的线性变换, 内积空间中的线性变换常常被称为线性算子.

现设 \(V\) 是 \(n\) 维内积空间 (不妨设之为酉空间),取 \(V\) 的一组标准正交基 \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}\) . 假定 \(\varphi\) 是 \(V\) 上的线性变换且它在这组基下的表示矩阵是

\[
A = \left( \begin{matrix} {a}_{11} & {a}_{12} & \cdots & {a}_{1n} \\ {a}_{21} & {a}_{22} & \cdots & {a}_{2n} \\ \vdots & \vdots & & \vdots \\ {a}_{n1} & {a}_{n2} & \cdots & {a}_{nn} \end{matrix}\right)
\]

又设 \(\alpha = {a}_{1}{e}_{1} + {a}_{2}{e}_{2} + \cdots + {a}_{n}{e}_{n},\beta = {b}_{1}{e}_{1} + {b}_{2}{e}_{2} + \cdots + {b}_{n}{e}_{n}\) . 记 \(\mathbf{x} =\) \({\left( {a}_{1},{a}_{2},\cdots ,{a}_{n}\right) }^{\prime },\mathbf{y} = {\left( {b}_{1},{b}_{2},\cdots ,{b}_{n}\right) }^{\prime }\) 分别是 \(\alpha,\beta\) 的坐标向量,则

\[
\left( {\varphi \left( \alpha\right) ,\beta}\right) = {\left( A\mathbf{x}\right) }^{\prime }\overline{\mathbf{y}} = {\mathbf{x}}^{\prime }{A}^{\prime }\overline{\mathbf{y}} = {\mathbf{x}}^{\prime }\overline{\left( {\overline{A}}^{\prime }\mathbf{y}\right) }.
\]


记矩阵 \({\overline{A}}^{\prime }\) 在 \(V\) 上定义的线性变换为 \(\mathbf{\psi }\) ,即对任意的 \(\beta = {b}_{1}{e}_{1} + {b}_{2}{e}_{2} + \cdots + {b}_{n}{e}_{n}\) , 定义 \(\mathbf{\psi }\left( \beta\right) = {c}_{1}{e}_{1} + {c}_{2}{e}_{2} + \cdots + {c}_{n}{e}_{n}\) ,其中

\[
{c}_{i} = {\bar{a}}_{1i}{b}_{1} + {\bar{a}}_{2i}{b}_{2} + \cdots + {\bar{a}}_{ni}{b}_{n}\left( {i = 1,2,\cdots ,n}\right) ,
\]
即 \(\psi \left( \beta\right)\) 的坐标向量

\[
\left( \begin{matrix} {c}_{1} \\ {c}_{2} \\ \vdots \\ {c}_{n} \end{matrix}\right) = {\overline{A}}^{\prime }\mathbf{y} = \left( \begin{matrix} {\bar{a}}_{11} & {\bar{a}}_{21} & \cdots & {\bar{a}}_{n1} \\ {\bar{a}}_{12} & {\bar{a}}_{22} & \cdots & {\bar{a}}_{n2} \\ \vdots & \vdots & & \vdots \\ {\bar{a}}_{1n} & {\bar{a}}_{2n} & \cdots & {\bar{a}}_{nn} \end{matrix}\right) \left( \begin{matrix} {b}_{1} \\ {b}_{2} \\ \vdots \\ {b}_{n} \end{matrix}\right) .
\]

于是有

\[
\left( {\varphi \left( \alpha\right) ,\beta}\right) = \left( {\alpha,\mathbf{\psi }\left( \beta\right) }\right)
\]

对一切 \(\alpha,\beta \in V\) 成立.

很容易验证上述结论对欧氏空间也成立(若为欧氏空间,$ \psi$在这组基下的表示矩阵为$ A'$).


\begin{definition}[伴随]
    设 \(\varphi\) 是内积空间 \(V\) 上的线性算子,若存在 \(V\) 上的线性算子 \({\varphi }^{ * }\) , 使等式

\[
\left( {\varphi \left( \alpha\right) ,\beta}\right) = \left( {\alpha,{\varphi }^{ * }\left( \beta\right) }\right)
\]

对一切 \(\alpha,\beta \in V\) 成立,则称 \({\varphi }^{ * }\) 是 \(\varphi\) 的伴随算子,简称为 \(\varphi\) 的伴随.
\end{definition}


\begin{theorem}
    \begin{enumerate}[(1)]
        \item 伴随算子若存在,必唯一;
        \item 有限维内积空间上任一线性算子必存在伴随算子.
    \end{enumerate}
\end{theorem}
\begin{proof}
    \begin{enumerate}[(1)]
        \item 若 \({\varphi }^{\sharp }\) 是 \(V\) 上的线性变换且

        \[
        \left( {\varphi \left( \alpha\right) ,\beta}\right) = \left( {\alpha,{\varphi }^{\sharp }\left( \beta\right) }\right)
        \]
        
        对一切 \(\alpha,\beta\) 成立,则 \(\left( {\alpha,{\mathbf{\varphi }}^{\sharp }\left( \beta\right) }\right) = \left( {\alpha,{\mathbf{\varphi }}^{ * }\left( \beta\right) }\right)\) 对一切 \(\alpha \in V\) 成立,即 \(\left( {\alpha,{\mathbf{\varphi }}^{\sharp }\left( \beta\right) - }\right.\) \(\left. {{\varphi }^{ * }\left( \beta \right) }\right) = 0\) 对一切 \(\alpha\) 成立,特别,对 \(\alpha = {\mathbf{\varphi }}^{\sharp }\left( \beta\right) - {\mathbf{\varphi }}^{ * }\left( \beta\right)\) 也成立. 由内积定义即知 \({\varphi }^{\sharp }\left( \beta\right) - {\varphi }^{ * }\left( \beta\right) = \mathbf{0}\) ,即 \({\varphi }^{\sharp }\left( \beta\right) = {\varphi }^{ * }\left( \beta\right)\) . 而 \(\beta\) 是任意的,故有 \({\varphi }^{\sharp } = {\varphi }^{ * }\) .
        \item 由唯一性以及一开始$ \psi$的构造可知结论成立.
    \end{enumerate}
\end{proof}


\begin{theorem}
    设 \(V\) 是 \(n\) 维内积空间, \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}\) 是 \(V\) 的一组标准正交基. 若 \(V\) 上的线性算子 \(\varphi\) 在这组基下的表示矩阵为 \(A = \left( {a}_{ij}\right)\) ,则如果 \(V\) 是酉空间,那么 \({\varphi }^{ * }\) 在同一组基下的表示矩阵为 \({\overline{A}}^{\prime } = {\left( {\bar{a}}_{ij}\right) }^{\prime }\) ,即 \(A\) 的共轭转置; 如果 \(V\) 是欧氏空间,那么 \({\varphi }^{ * }\) 的表示矩阵为 \({A}^{\prime }\) ,即 \(A\) 的转置.
\end{theorem}
\begin{proof}
    见本节一开始的讨论.
\end{proof}


伴随算子有下列性质.

\begin{theorem}
    设 \(V\) 是有限维内积空间,若 \(\varphi\) 及 \(\psi\) 是 \(V\) 上的线性变换, \(c\) 为常数, 则
    \begin{enumerate}[(1)]
        \item \({\left( \varphi + \psi \right) }^{ * } = {\varphi }^{ * } + {\psi }^{ * }\);
        \item \({\left( c\varphi \right) }^{ * } = \bar{c}{\varphi }^{ * }\);
        \item \({\left( \varphi \psi \right) }^{ * } = {\psi }^{ * }{\varphi }^{ * }\);
        \item \({\left( {\varphi }^{ * }\right) }^{ * } = \varphi\) ;
        \item 若$ \varphi$可逆,则$ \varphi^*$也可逆,并且$ (\varphi^{-1})^* =(\varphi^*)^{-1} $.
    \end{enumerate}
\end{theorem}


关于伴随的不变子空间和特征值有下面的结果.

\begin{proposition}
    设 \(V\) 是 \(n\) 维内积空间, \(\varphi\) 是 \(V\) 上的线性算子.
\begin{enumerate}[(1)]
    \item 若 \(U\) 是 \(\varphi\) 的不变子空间,则 \({U}^{ \bot }\) 是 \({\varphi }^{ * }\) 的不变子空间;
    \item 若 \(\varphi\) 的全体特征值为 \({\lambda }_{1},{\lambda }_{2},\cdots ,{\lambda }_{n}\) ,则 \({\varphi }^{ * }\) 的全体特征值为 \({\bar{\lambda }}_{1},{\bar{\lambda }}_{2},\cdots ,{\bar{\lambda }}_{n}\) .
\end{enumerate}
\end{proposition}
\begin{proof}
    \begin{enumerate}[(1)]
        \item 设 \(\alpha \in U,\beta \in {U}^{ \bot }\) ,因为

        \[
        \left( {\alpha,{\mathbf{\varphi }}^{ * }\left( \beta\right) }\right) = \left( {\mathbf{\varphi }\left( \alpha\right) ,\beta}\right) = 0
        \]
        
        所以 \({U}^{ \bot }\) 是 \({\varphi }^{ * }\) 的不变子空间.
        \item 取 \(V\) 的一组标准正交基,记 \(A\) 是 \(\varphi\) 的表示矩阵,则无论 \(V\) 是酉空间还是欧氏空间, \({\varphi }^{ * }\) 的表示矩阵总可写为 \({\overline{A}}^{\prime }\) . 由假设

        \[
        \left| {\lambda {I}_{n} - A}\right| = \left( {\lambda - {\lambda }_{1}}\right) \left( {\lambda - {\lambda }_{2}}\right) \cdots \left( {\lambda - {\lambda }_{n}}\right)
        \]
        令$ \lambda=\bar{\mu}$,于是有
        \begin{align*}
            \left| {\lambda {{I}}_{n} - {\overline{A}}^{\prime }}\right| = \left| \bar{\mu}I_n -{\overline{A}}^{\prime } \right|&=\overline{|\mu I_n - A|} = \overline{(\mu-\lambda_1) (\mu-\lambda_2) \cdots (\mu-\lambda_n)}\\
            &= (\bar{\mu} - \bar{\lambda_1}) (\bar{\mu} - \bar{\lambda_2}) \cdots (\bar{\mu} - \bar{\lambda_n}) \\
            &= (\lambda-\bar{\lambda_1}) (\lambda-\bar{\lambda_2}) \cdots (\lambda-\bar{\lambda_n})
        \end{align*}
        故结论成立.
    \end{enumerate}
\end{proof}



\begin{example}
    $ V = U \bot U^{\bot}$,$ E$为从$ U$到$ V$的正交投影,则有
    \[ (E(\alpha),\beta) = ( \alpha, E(\beta)), \]
    即$ E^* =E$.
\end{example}


%%%%%%%%%%%%%%%%%%内积空间的同构, 正交变换和酉变换
\section{内积空间的同构, 正交变换和酉变换}


在第四章中,我们曾经讨论过抽象的 \(n\) 维线性空间和 \(n\) 维列向量空间 (或行向量空间) 的同构. 我们知道若在 \(V\) 中取定一组基,将 \(V\) 中向量映射到它在这组基下坐标向量的映射是一个线性同构. 现在设 \(V\) 是 \(n\) 维欧氏空间, \(\left\{ {{v}_{1},{v}_{2},\cdots ,{v}_{n}}\right\}\) 是 \(V\) 的一组标准正交基. 又设 \({\mathbb{R}}_{n}\) 是 \(n\) 维实列向量空间, \({\mathbb{R}}_{n}\) 的内积取为标准内积. 令 \(\varphi\) 为 \(V \rightarrow {\mathbb{R}}_{n}\) 的线性映射,它将 \(V\) 中向量 \(x\) 变为其坐标向量,即

若 \(x = {x}_{1}{v}_{1} + {x}_{2}{v}_{2} + \cdots + {x}_{n}{v}_{n}\) ,则 \(\varphi \left( x\right) = {\left( {x}_{1},{x}_{2},\cdots ,{x}_{n}\right) }^{\prime }\) . 我们已经知道 \(\varphi\) 是同构. 此外若令 \(y = {y}_{1}{v}_{1} + {y}_{2}{v}_{2} + \cdots + {y}_{n}{v}_{n}\) ,则

\[
\left( {\varphi \left( x\right) ,\varphi \left( y\right) }\right) = {x}_{1}{y}_{1} + {x}_{2}{y}_{2} + \cdots + {x}_{n}{y}_{n} = \left( {x,y}\right) .
\]

因此映射 \(\varphi\) 是一个保持内积的同构. 因为向量的长度、向量之间的距离都是由内积决定的,故 \(\varphi\) 保持向量的长度和向量间的距离. 当 \(V\) 是酉空间时,类似的结论也成立. 于是我们可以把对抽象内积空间的研究归结为对 \({\mathbb{R}}_{n}\) 或 \({\mathbb{C}}_{n}\) 的研究.

\begin{definition}
    设 \(V\) 与 \(U\) 是域 \(\mathbb{K}\) 上的内积空间, \(\mathbb{K}\) 是实数域或复数域, \(\varphi\) 是 \(V \rightarrow U\) 的线性映射. 若对任意的 \(x,y \in V\) ,有

\[
\left( {\varphi \left( x\right) ,\varphi \left( y\right) }\right) = \left( {x,y}\right)
\]

则称 \(\varphi\) 是 \(V \rightarrow U\) 的保持内积的线性映射. 又若 \(\varphi\) 作为线性映射是同构,则称 \(\varphi\) 是内积空间 \(V\) 到 \(U\) 上的保积同构.
\end{definition}

\begin{note}
    \begin{enumerate}[(1)]
        \item 内积空间的保积同构是一种等价关系;
        \item 保持内积的线性映射一定是单射;
        
        任取$ \alpha\in \operatorname{Ker}\varphi$,即$ \varphi(\alpha) = 0$,
        \[(\alpha,\alpha) = (\varphi(\alpha),\varphi(\alpha)) = 0,\]
        由内积的正定性可知$ \alpha = 0$. 
    \end{enumerate}
\end{note}


保持内积的线性映射不一定是满射.
\begin{example}
    嵌入映射:
    \[
    \begin{aligned}
    \varphi : \mathbb{R}^{2} & \rightarrow \mathbb{R}^{3} \\ 
    (x,y)' & \rightarrow (x,y,0)'
    \end{aligned}
    \]
    该线性映射保持内积,但不是满射.
\end{example}


保持内积一定保持范数.

令$\alpha = \beta$,则有
\[ \parallel \varphi(\alpha) \parallel^2 = (\varphi(\alpha),\varphi(\alpha))=(\alpha,\alpha)=\parallel \alpha \parallel^2,  \]
从而有 \[  \parallel \varphi(\alpha) \parallel =\parallel \alpha \parallel .\]


\begin{proposition}
    若 \(\varphi\) 是内积空间 \(V\) 到内积空间 \(U\) 的保持范数的线性映射,则 \(\varphi\) 保持内积.
\end{proposition}

\begin{proof}
    向量的范数可以用内积表示,反过来内积也可以用范数来表示. 设 \(x,y\) 是 \(V\) 中的任意两个向量,则

    \[
    \parallel x + y{\parallel }^{2} = \left( {x + y,x + y}\right) = \left( {x,x}\right) + \left( {y,y}\right) + \left( {x,y}\right) + \left( {y,x}\right)
    \]
    
    \[
    \parallel x - y{\parallel }^{2} = \left( {x - y,x - y}\right) = \left( {x,x}\right) + \left( {y,y}\right) - \left( {x,y}\right) - \left( {y,x}\right) ,
    \]
    若$ V$为欧氏空间,得到 
    \[
\left( {x,y}\right) = \frac{1}{4}\parallel x + y{\parallel }^{2} - \frac{1}{4}\parallel x - y{\parallel }^{2}.
\]

若$ V$为酉空间,得到
\[
\parallel x + y{\parallel }^{2} - \parallel x - y{\parallel }^{2} = 2\left( {x,y}\right) + 2\overline{\left( x,y\right) }.
\]
另一方面,

\[
\parallel x + \mathrm{i}y{\parallel }^{2} = \left( {x + \mathrm{i}y,x + \mathrm{i}y}\right) = \left( {x,x}\right) + \left( {y,y}\right) + \mathrm{i}\left( {y,x}\right) - \mathrm{i}\left( {x,y}\right) ,
\]


\[
\parallel x - \mathrm{i}y{\parallel }^{2} = \left( {x - \mathrm{i}y,x - \mathrm{i}y}\right) = \left( {x,x}\right) + \left( {y,y}\right) - \mathrm{i}\left( {y,x}\right) + \mathrm{i}\left( {x,y}\right) ,
\]

故

\[
\parallel x + \mathrm{i}y{\parallel }^{2} - \parallel x - \mathrm{i}y{\parallel }^{2} = - 2\mathrm{i}\left( {x,y}\right) + 2\mathrm{i}\overline{\left( x,y\right) }.
\]
从而有 
\[
\left( {x,y}\right) = \frac{1}{4}\parallel x + y{\parallel }^{2} - \frac{1}{4}\parallel x - y{\parallel }^{2} + \frac{\mathrm{i}}{4}\parallel x + iy{\parallel }^{2} - \frac{\mathrm{i}}{4}\parallel x - iy{\parallel }^{2}.
\]
\end{proof}



由于保持内积与保持范数的等价性, 保持内积的同构也称为保范同构或保距同构.


\begin{theorem}
    设 \(V\) 与 \(U\) 都是 \(n\) 维内积空间 (同为实空间或同为复空间),若 \(\varphi\) 是 \(V \rightarrow U\) 的线性映射,则下列命题等价:
    \begin{enumerate}[(1)]
        \item \(\varphi\) 保持内积;
        \item \(\varphi\) 是保积同构;
        \item \(\varphi\) 将 \(V\) 的任一组标准正交基变成 \(U\) 的一组标准正交基;
        \item \(\varphi\) 将 \(V\) 的某一组标准正交基变成 \(U\) 的一组标准正交基.
    \end{enumerate}
\end{theorem}

\begin{proof}
    \(\left( 1\right) \Rightarrow \left( 2\right) : \varphi\) 保持内积,因此 \(\varphi\) 为单映射. 由维数公式可得

\[
\dim \operatorname{Im}\varphi = \dim V = n.
\]

因此 \(\operatorname{Im}\varphi = U\) ,即 \(\varphi\) 是映上的,故为同构.

\(\left( 2\right) \Rightarrow \left( 3\right)\) : 设 \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}\) 是 \(V\) 的任意一组标准正交基. 由于 \(\varphi\) 保持内积,故对 \(i \neq j\) ,有

\[
\left( {\varphi \left( {e}_{i}\right) ,\varphi \left( {e}_{j}\right) }\right) = \left( {{e}_{i},{e}_{j}}\right) = 0
\]

又

\[
\left( {\varphi \left( {e}_{i}\right) ,\varphi \left( {e}_{i}\right) }\right) = \left( {{e}_{i},{e}_{i}}\right) = 1.
\]

这表明 \(\left\{ {\varphi \left( {e}_{1}\right) ,\varphi \left( {e}_{2}\right) ,\cdots ,\varphi \left( {e}_{n}\right) }\right\}\) 是 \(U\) 的标准正交基.

\(\left( 3\right) \Rightarrow \left( 4\right)\) : 显然.

(4) \(\Rightarrow\) (1): 设 \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}\) 是 \(V\) 的标准正交基且 \(\left\{ {\varphi \left( {e}_{1}\right) ,\varphi \left( {e}_{2}\right) ,\cdots }\right.\) , \(\left. {\varphi \left( {e}_{n}\right) }\right\}\) 是 \(U\) 的标准正交基. 假定

\[
u = \mathop{\sum }\limits_{{i = 1}}^{n}{a}_{i}{e}_{i},v = \mathop{\sum }\limits_{{i = 1}}^{n}{b}_{i}{e}_{i}
\]

则

\[
\varphi \left( u\right) = \mathop{\sum }\limits_{{i = 1}}^{n}{a}_{i}\varphi \left( {e}_{i}\right) ,\varphi \left( v\right) = \mathop{\sum }\limits_{{i = 1}}^{n}{b}_{i}\varphi \left( {e}_{i}\right) ,
\]

\begin{align*}
    \left( {\varphi \left( u\right) ,\varphi \left( v\right) }\right) &= \left( {\mathop{\sum }\limits_{{i = 1}}^{n}{a}_{i}\varphi \left( {e}_{i}\right) ,\mathop{\sum }\limits_{{i = 1}}^{n}{b}_{i}\varphi \left( {e}_{i}\right) }\right)\\
    &= {a}_{1}{\bar{b}}_{1} + {a}_{2}{\bar{b}}_{2} + \cdots + {a}_{n}{\bar{b}}_{n}\\
    &= \left( {u,v}\right) \text{.}
\end{align*}
\end{proof}


\begin{corollary}
    两个有限维内积空间 \(V\) 与 \(U\) (同为实空间或同为复空间) 同构的充分必要条件是它们有相同的维数.
\end{corollary}
\begin{proof}
必要性:显然(保积同构的前提是同构,从而维数相同).

    只需证明充分性. 设 \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}\) 是 \(V\) 的标准正交基,$ \{f_1, f_2,\cdots,f_n\}$是 \(U\) 的标准正交基,令 \(\varphi\) 是 \(V \rightarrow U\) 的线性映射:

\[
\varphi \left( {e}_{i}\right) = {f}_{i}
\]

则 \(\varphi\) 将标准正交基变为标准正交基,由定理可知 \(\varphi\) 是保积同构.
\end{proof}


现在我们来讨论同一个内积空间上的保积自同构及其表示矩阵.

\begin{definition}
    设 \(V\) 是欧氏空间,若 \(\varphi\) 是 \(V\) 上保持内积的线性变换,则称 \(\varphi\) 为 \(V\) 上的正交变换或正交算子. 若 \(U\) 是酉空间,则 \(U\) 上保持内积的线性变换称为酉变换或酉算子.
\end{definition}
显然正交变换及酉变换都是可逆线性变换(由上述定理的(2)可知,$ \varphi$是自同构的).


\begin{theorem}
    设 \(\varphi\) 是欧氏空间或酉空间上的线性变换,则 \(\varphi\) 是正交变换或酉变换的充分必要条件是 \(\varphi\) 可逆,且
\[
{\varphi }^{-1} = {\varphi }^{ * }
\]
\end{theorem}
\begin{proof}
    必要性:可逆已成立,只需证明$ \varphi^{-1} = {\varphi }^{ * }$即可.

    则对 \(V\) 中的任意向量 \(\alpha,\beta\) ,有
\[
\left( {\varphi \left( \alpha\right) ,\beta}\right) = \left( {\varphi \left( \alpha\right) ,\varphi \left( {{\varphi }^{-1}\left( \beta\right) }\right) }\right) = \left( {\alpha,{\varphi }^{-1}\left( \beta\right) }\right) .
\]
此即 \({\varphi }^{ * } = {\varphi }^{-1}\) (伴随定义以及唯一性).

充分性:若 \({\varphi }^{ * } = {\varphi }^{-1}\) ,则

\[
\left( {\varphi \left( \alpha\right) ,\varphi \left( \beta\right) }\right) = \left( {\alpha,{\varphi }^{ * }\varphi \left( \beta\right) }\right) = \left( {\alpha,\beta}\right) .
\]

\(\varphi\) 保持内积.
\end{proof}


如果在内积空间 \(V\) 中取定一组标准正交基,那么正交 (酉) 变换的表示矩阵有什么特点呢?

\begin{definition}
    设 \(A\) 是 \(n\) 阶实方阵,若 \({A}^{\prime } = {A}^{-1}\) ,则称 \(A\) 是正交矩阵. 又若 \(C\) 是 \(n\) 阶复方阵且 \({\overline{C}}^{\prime } = {C}^{-1}\) ,则称 \(C\) 是酉矩阵.
\end{definition}


\begin{theorem}
    设 \(\varphi\) 是欧氏空间 (酉空间) \(V\) 上的正交变换 (酉变换),则在 \(V\) 的任一组标准正交基下, \(\varphi\) 的表示矩阵是正交矩阵 (酉阵).
\end{theorem}
\begin{proof}
    由上述定理,当 \(\varphi\) 是正交变换时,若 \(\varphi\) 在 \(V\) 的一组标准正交基下的表示矩阵为 \(A\) ,则 \({\varphi }^{ * }\) 在同一组基下的表示矩阵为 \({A}^{\prime }\) ,由 \({\varphi }^{ * } = {\varphi }^{-1}\) 得 \({A}^{\prime } = {A}^{-1}\) , \(A\) 是正交矩阵. 同理,当 \(\varphi\) 是酉变换时, \(\varphi\) 在标准正交基下的表示矩阵 \(A\) 应适合 \({\overline{A}}^{\prime } = {A}^{-1}\) ,即 \(A\) 是酉矩阵.
\end{proof}

\begin{note}
    上述定理的逆命题也是正确的,即若线性变换 \(\varphi\) 在一组标准正交基下的表示矩阵为正交 (酉) 矩阵,则 \(\varphi\) 是正交 (酉) 变换. 这由线性变换与其表示矩阵的关系即得.
\end{note}




由正交矩阵与酉矩阵的定义可知正交矩阵适合条件 \(A{A}^{\prime } = {A}^{\prime }A = {I}_{n}\) ; 酉矩阵适合条件 \({\overline{A}}^{\prime }A = A{\overline{A}}^{\prime } = {I}_{n}\) .


\begin{theorem}
    设 \(A = \left( {a}_{ij}\right)\) 是 \(n\) 阶实矩阵,则 \(A\) 是正交矩阵的充分必要条件是:

\[
{a}_{i1}{a}_{j1} + {a}_{i2}{a}_{j2} + \cdots + {a}_{in}{a}_{jn} = 0,i \neq j,
\]

\[
{a}_{i1}^{2} + {a}_{i2}^{2} + \cdots + {a}_{in}^{2} = 1
\]

或

\[
{a}_{1i}{a}_{1j} + {a}_{2i}{a}_{2j} + \cdots + {a}_{ni}{a}_{nj} = 0,i \neq j,
\]


\[
{a}_{1i}^{2} + {a}_{2i}^{2} + \cdots + {a}_{ni}^{2} = 1
\]
也就是说, \(A\) 为正交矩阵的充分必要条件是它的 \(n\) 个行向量是 \(n\) 维实行向量空间组成的欧氏空间 (取标准内积) 的标准正交基; 或它的 \(n\) 个列向量是 \(n\) 维实列向量空间组成的欧氏空间 (取标准内积) 的标准正交基.
\end{theorem}
\begin{proof}
    对$ A$进行行分块得到
    \[ A = \begin{pmatrix}
        \alpha_1\\
        \alpha_2\\
        \vdots\\
        \alpha_n
    \end{pmatrix}, \]
    于是 
    \[ I_n  = A A' = \begin{pmatrix}
        \alpha_1\\
        \alpha_2\\
        \vdots\\
        \alpha_n
    \end{pmatrix}\begin{pmatrix}
        \alpha'& \alpha'& \cdots & \alpha_n'
    \end{pmatrix} , \]
    第$ (i,j)$元素为$ \alpha_i \alpha'_j = \delta_{ij}$,恰好为$ (\alpha_i, \alpha_j)$在$ \mathbb{R}_n$上的标准内积.

    另一个结论也是同理.
\end{proof}



同理我们可证明下述定理.

\begin{theorem}
    设 \(A = \left( {a}_{ij}\right)\) 是 \(n\) 阶复矩阵,则 \(A\) 是酉矩阵的充分必要条件是:

\[
{a}_{i1}{\bar{a}}_{j1} + {a}_{i2}{\bar{a}}_{j2} + \cdots + {a}_{in}{\bar{a}}_{jn} = 0,i \neq j
\]

\[
{\left| {a}_{i1}\right| }^{2} + {\left| {a}_{i2}\right| }^{2} + \cdots + {\left| {a}_{in}\right| }^{2} = 1
\]

或

\[
{a}_{1i}{\bar{a}}_{1j} + {a}_{2i}{\bar{a}}_{2j} + \cdots + {a}_{ni}{\bar{a}}_{nj} = 0,i \neq j,
\]

\[
{\left| {a}_{1i}\right| }^{2} + {\left| {a}_{2i}\right| }^{2} + \cdots + {\left| {a}_{ni}\right| }^{2} = 1.
\]

也就是说, \(A\) 为酉矩阵的充分必要条件是它的 \(n\) 个行向量是 \(n\) 维复行向量空间组成的酉空间 (取标准内积) 的标准正交基; 或它的 \(n\) 个列向量是 \(n\) 维复列向量空间组成的酉空间 (取标准内积) 的标准正交基.
\end{theorem}


\begin{example}
    \begin{enumerate}[(1)]
        \item  单位阵是正交矩阵也是酉矩阵;
        \item 对角阵是正交矩阵的充分必要条件是主对角线上的元素为 1 或 -1 .
        \item 二阶正交阵只能分为两类.
        \begin{itemize}
            \item 逆时针旋转$ \theta$.即为 
            \[ \begin{pmatrix}
                \cos \theta&-\sin \theta\\
                \sin \theta&\cos \theta    
            \end{pmatrix}, \]
            \item 反射(第二列为旋转矩阵第二列的-1倍),
            即为\[ \begin{pmatrix}
                \cos \theta&\sin \theta\\
                \sin \theta&-\cos \theta
            \end{pmatrix}. \]
        \end{itemize}
        也就是说,若二阶行列式值为1,就是旋转;行列式值为-1,就是反射.
    \end{enumerate}
\end{example}


\begin{corollary}
    若 \(n\) 阶实矩阵 \(A\) 是正交矩阵,则
\begin{enumerate}[(1)]
    \item \(A\) 的行列式值等于 1 或 -1 ;
    \item \(A\) 的特征值的绝对值 (模长) 等于 1 .
\end{enumerate}
\end{corollary}

\begin{corollary}
    若 \(n\) 阶复矩阵 \(A\) 是酉矩阵,则
\begin{enumerate}[(1)]
    \item \(A\) 的行列式值的模长等于 1 ;
    \item  \(A\) 的特征值的绝对值 (模长) 等于 1 .
\end{enumerate}
\end{corollary}



下面我们证明矩阵分解理论中的一个重要定理,称为矩阵的 \({QR}\) 分解.

\begin{theorem}
    设 \(A\) 是 \(n\) 阶实 (复) 矩阵,则 \(A\) 可分解为

\[
A = {QR}
\]

其中 \(Q\) 是正交 (酉) 矩阵, \(R\) 是一个上三角阵且主对角线上的元素均大于等于零, 并且若 \(A\) 是非异阵,则这样的分解必唯一.
\end{theorem}
\begin{proof}
    设 \(A\) 是 \(n\) 阶实矩阵, \(A = \left( {{u}_{1},{u}_{2},\cdots ,{u}_{n}}\right)\) 是 \(A\) 的列分块. 考虑 \(n\) 维实列向量空间 \({\mathbb{R}}_{n}\) ,并取其标准内积,我们先通过类似于 Gram-Schmidt 方法的正交化过程,把 \(\left\{ {{u}_{1},{u}_{2},\cdots ,{u}_{n}}\right\}\) 变成一组两两正交的向量 \(\left\{ {{w}_{1},{w}_{2},\cdots ,{w}_{n}}\right\}\) ,并且 \({w}_{k}\) 或者是零向量或者是单位向量.

我们用数学归纳法来定义上述向量 \({w}_{k}\left( {k = 1,2,\cdots ,n}\right)\) . 假设 \({w}_{1},\cdots ,{w}_{k - 1}\) 已经定义好,现来定义 \({w}_{k}\) . 令

\[
{v}_{k} = {u}_{k} - \mathop{\sum }\limits_{{j = 1}}^{{k - 1}}\left( {{u}_{k},{w}_{j}}\right) {w}_{j}
\]

若 \({v}_{k} = \mathbf{0}\) ,则令 \({w}_{k} = \mathbf{0}\) ; 若 \({v}_{k} \neq \mathbf{0}\) ,则令 \({w}_{k} = \frac{{v}_{k}}{\begin{Vmatrix}{v}_{k}\end{Vmatrix}}\) . 容易验证 \(\left\{ {{w}_{1},{w}_{2},\cdots ,{w}_{n}}\right\}\) 是一组两两正交的向量, \({w}_{k}\) 或者是零向量或者是单位向量,并且满足:

\begin{align}\label{equation:9.1}
    {u}_{k} = \mathop{\sum }\limits_{{j = 1}}^{{k - 1}}\left( {{u}_{k},{w}_{j}}\right) {w}_{j} + \begin{Vmatrix}{v}_{k}\end{Vmatrix}{w}_{k},k = 1,2,\cdots ,n.
\end{align}
由 上式可得

\[
A = \left( {{u}_{1},{u}_{2},\cdots ,{u}_{n}}\right) = \left( {{w}_{1},{w}_{2},\cdots ,{w}_{n}}\right) R,
\]

其中 \(R\) 是一个上三角阵且主对角线上的元素依次为 \(\begin{Vmatrix}{v}_{1}\end{Vmatrix},\begin{Vmatrix}{v}_{2}\end{Vmatrix},\cdots ,\begin{Vmatrix}{v}_{n}\end{Vmatrix}\) ,均大于等于零,并且由 \eqref{equation:9.1} 式知,如果 \({w}_{k} = \mathbf{0}\) ,则 \(R\) 的第 \(k\) 行元素全为零.

假设 \({w}_{{i}_{1}},{w}_{{i}_{2}},\cdots ,{w}_{{i}_{r}}\) 是其中的非零向量全体,可将它们扩张为 \({\mathbb{R}}_{n}\) 的一组标准正交基 \(\left\{ {{\widetilde{w}}_{1},{\widetilde{w}}_{2},\cdots ,{\widetilde{w}}_{n}}\right\}\) ,其中 \({\widetilde{w}}_{j} = {w}_{j},j = {i}_{1},{i}_{2},\cdots ,{i}_{r}\) .

令 \(Q = \left( {{\widetilde{w}}_{1},{\widetilde{w}}_{2},\cdots ,{\widetilde{w}}_{n}}\right)\) , \(Q\) 是正交矩阵. 注意到若 \({w}_{k} = \mathbf{0}\) , 则 \(R\) 的第 \(k\) 行元素全为零,此时用 \({\widetilde{w}}_{k}\) 代替 \({w}_{k}\) 仍然可使 \eqref{equation:9.1} 式成立,因此
\[
A = \left( {{u}_{1},{u}_{2},\cdots ,{u}_{n}}\right) = \left( {{\widetilde{w}}_{1},{\widetilde{w}}_{2},\cdots ,{\widetilde{w}}_{n}}\right) R = QR,
\]
从而得到了 \(A\) 的 \({QR}\) 分解.
\end{proof}


%%%%%%%%%%%%%%%%%-----------自伴随算子

\section{自伴随算子}

在下面的几节里我们将讨论与相似标准型类似的问题: 一个内积空间上的线性变换适合什么条件,它在一组标准正交基下的表示矩阵有比较简单的形状? 设 \(n\) 维内积空间 \(V\) 上的线性变换 \(\varphi\) 在一组标准正交基下的表示矩阵为 \(A\) ,在另一组标准正交基下的表示矩阵为 \(B\) ,两组基之间的过渡矩阵为 \(P\) ,我们首先要问: \(P\) 是一个什么样的矩阵?



\begin{lemma}
    欧氏空间中两组标准正交基之间的过渡矩阵是正交矩阵, 酉空间中两组标准正交基之间的过渡矩阵是酉矩阵.
\end{lemma}
\begin{proof}
    设 \(V\) 是 \(n\) 维欧氏空间, \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}\) 和 \(\left\{ {{f}_{1},{f}_{2},\cdots ,{f}_{n}}\right\}\) 是 \(V\) 的两组标准正交基且
\[ (f_1,f_2,\cdots,f_n) = (e_1,e_2,\cdots,e_n)P, \]
$ P$为过渡矩阵,$ P = (a_{ij})_{n\times n}$.则 
\[ f_j = \sum_{i=1}^n a_{ij}e_i,f_k = \sum_{i=1}^n a_{ik}e_i, k = 1,2,\cdots,n. \]
从而 
\[ \delta_{jk} = (f_j,f_k) = \sum_{i=1}^n a_{ij}a_{ik},  \]
即$ P$的$ n$个列向量是列向量空间$ \mathbb{R}^n$的一组标准正交基,从而$ P$是正交阵.

酉空间的证明类似.
\end{proof}


根据引理我们知道,当 \(V\) 是欧氏空间时,

\[
B = {P}^{-1}AP = {P}^{\prime }AP
\]

当 \(V\) 是酉空间时,有

\[
B = {P}^{-1}AP = {\overline{P}}^{\prime }AP.
\]

\begin{definition}
    设 \(A,B\) 是 \(n\) 阶实矩阵,若存在正交矩阵 \(P\) ,使 \(B = {P}^{\prime }{AP}\) 成立,则称 \(B\) 和 \(A\) 正交相似. 设 \(A,B\) 是 \(n\) 阶复矩阵,若存在酉矩阵 \(P\) , 使 \(B = {\overline{P}}^{\prime }AP\) ,则称 \(B\) 和 \(A\) 酉相似.
\end{definition}



和矩阵的相似关系一样, 我们不难证明正交 (酉) 相似关系是等价关系, 即:

\begin{enumerate}[(1)]
    \item \(n\) 阶矩阵 \(A\) 和自己正交 (酉) 相似;
    \item 若 \(B\) 和 \(A\) 正交 (酉) 相似,则 \(A\) 和 \(B\) 也正交 (酉) 相似;
    \item 若 \(B\) 和 \(A\) 正交 (酉) 相似, \(C\) 和 \(B\) 正交 (酉) 相似,则 \(C\) 和 \(A\) 也正交 (酉) 相似.
\end{enumerate}


我们的问题是寻找一类矩阵的正交 (酉) 相似标准型. 显而易见, 正交 (酉) 相似比普通的相似要求更高, 因此对一般的矩阵寻求它们的正交 (酉) 相似标准型将是很困难的. 在这一节里我们将把注意力限制在一类特殊的矩阵 —— Hermite 矩阵和实对称阵上.


\begin{definition}
    设 \(\varphi\) 是内积空间 \(V\) 上的线性变换, \({\varphi }^{ * }\) 是 \(\varphi\) 的伴随,若 \({\varphi }^{ * } = \varphi\) , 则称 \(\varphi\) 是自伴随算子. 在 \(V\) 是欧氏空间的情形, \(\varphi\) 称为对称算子或对称变换, 在 \(V\) 是酉空间的情形, \(\varphi\) 称为 Hermite 算子或 Hermite 变换. 
\end{definition}



\begin{example}
    设 \(V\) 是 \(n\) 维内积空间, \({V}_{0}\) 是 \(V\) 的子空间, \(V = {V}_{0} \oplus {V}_{0}^{ \bot }\) . 令 \(e\) 是 \(V\) 到 \({V}_{0}\) 上的正交投影, 即 
    \[ \forall \alpha,\beta \in V,(e(\alpha),\beta) = (\alpha,e(\beta)), \]  则 \(e\) 是自伴随算子.
\end{example}



若 \(V\) 是 \(n\) 维欧氏空间, \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}\) 是一组标准正交基,设 \(\varphi\) 在这组基下的表示矩阵为 \(A\) ,则 \({\varphi }^{ * }\) 在同一组基下的表示矩阵为 \({A}^{\prime }\) . 若 \({\varphi }^{ * } = \varphi\) ,则 \({A}^{\prime } = A\) . 也就是说欧氏空间上的自伴随算子在任一组标准正交基下的表示矩阵都是实对称阵. 同理可证明酉空间上的自伴随算子在任一组标准正交基下的表示矩阵都是 Hermite 矩阵. 反之亦容易看出,若 \(V\) 是欧氏空间,线性变换 \(\varphi\) 在某组标准正交基下的表示矩阵是实对称阵,则 \({\varphi }^{ * } = \varphi\) . 对酉空间也有类似结论(为Hermite矩阵).




\begin{theorem}
    设 \(V\) 是 \(n\) 维酉空间, \(\varphi\) 是 \(V\) 上的自伴随算子,则 \(\varphi\) 的特征值全是实数且属于不同特征值的特征向量互相正交.
\end{theorem}
\begin{proof}
    设 \(\lambda\) 是 \(\varphi\) 的特征值, \(x\) 是属于 \(\lambda\) 的特征向量,则
\begin{align*}
    \lambda \left( {x,x}\right) &= \left( {\lambda x,x}\right) = \left( {\varphi \left( x\right) ,x}\right) = \left( {x,{\varphi }^{ * }\left( x\right) }\right)\\
    &= \left( {x,\varphi \left( x\right) }\right) = \left( {x,\lambda x}\right) = \bar{\lambda }\left( {x,x}\right) .
\end{align*}


因为 \(\left( {x,x}\right) \neq 0\) ,故 \(\bar{\lambda } = \lambda ,\lambda\) 是实数. 又若设 \(\mu\) 是 \(\varphi\) 的另一个特征值, \(y\) 是属于 \(\mu\) 的特征向量,注意到 \(\lambda ,\mu\) 都是实数,我们有
\begin{align*}
    \lambda \left( {x,y}\right) &= \left( {\lambda x,y}\right) = \left( {\varphi \left( x\right) ,y}\right) = \left( {x,{\varphi }^{ * }\left( y\right) }\right)\\
    &= \left( {x,\varphi \left( y\right) }\right) = \left( {x,\mu y}\right) = \mu \left( {x,y}\right)
\end{align*}
由于 \(\mu \neq \lambda\) ,因此 \(\left( {x,y}\right) = 0\) ,即 \(x \bot y\) .
\end{proof}



\begin{corollary}
    Hermite 矩阵的特征值全是实数, 实对称阵的特征值也全是实数. 这两种矩阵属于不同特征值的特征向量互相正交.
\end{corollary}
\begin{proof}
Hermite 矩阵的结论是定理的显然推论, 而实对称阵也是 Hermite 矩阵, 因此结论成立.
\end{proof}



\begin{corollary}
    $ \varphi$为欧氏空间的自伴随算子,则$ \varphi$的特征值都是实数,并且属于不同特征值的特征向量互相正交.
\end{corollary}
\begin{proof}
    由代数与几何的一一对应关系即可得到.
\end{proof}


\begin{theorem}
    设 \(V\) 是 \(n\) 维内积空间, \(\varphi\) 是 \(V\) 上的自伴随算子,则存在 \(V\) 的一组标准正交基,使得 \(\varphi\) 在这组基下的表示矩阵为实对角阵,且这组基恰为 \(\varphi\) 的 \(n\) 个线性无关的特征向量.
\end{theorem}
\begin{proof}
    首先我们需要说明的是若 \(V\) 是欧氏空间,由于自伴随算子 \(\varphi\) 的特征值是实数,因此有实的特征向量. 不妨设 \(u\) 是 \(\varphi \) 的特征向量,令 \({v}_{1} = \frac{u}{\parallel u\parallel }\) ,则 \({v}_{1}\) 是 \(\varphi\) 的长度等于 1 的特征向量. 我们对维数 \(n\) 用归纳法.

若 \(\dim V = 1\) ,结论已成立. 设对小于 \(n\) 维的内积空间结论成立. 令 \(W\) 为 \({v}_{1}\) 张成的子空间, \({W}^{ \bot }\) 为 \(W\) 的正交补空间,则 \(W\) 是 \(\varphi\) 的不变子空间且

\[
V = W \oplus {W}^{ \bot },\dim {W}^{ \bot } = n - 1.
\]
从而 \({W}^{ \bot }\) 是 \({\varphi }^{ * } = \varphi\) 的不变子空间\footnote{$ \varphi$ 是$ U$的不变子空间,则$ \varphi^*$是$ U^{\bot}$的不变子空间.}. 将 \(\varphi\) 限制在 \({W}^{ \bot }\) 上仍是自伴随算子. 由归纳假设,存在 \({W}^{ \bot }\) 的一组标准正交基 \(\left\{ {{v}_{2},\cdots ,{v}_{n}}\right\}\) ,在这组基下 \(\varphi\) 的表示矩阵为实对角阵,且 \(\left\{ {{v}_{2},\cdots ,{v}_{n}}\right\}\) 是其特征向量. 因此, \(\left\{ {{v}_{1},{v}_{2},\cdots ,{v}_{n}}\right\}\) 构成了 \(V\) 的一组标准正交基, \(\varphi \) 在这组基下的表示矩阵为实对角阵,且 \(\left\{ {{v}_{1},{v}_{2},\cdots ,{v}_{n}}\right\}\) 为 \(\varphi\) 的特征向量.
\end{proof}




\begin{theorem}
    设 \(A\) 是 \(n\) 阶 Hermite 矩阵,则存在酉矩阵 \(P\) ,使得 \({\overline{P}}^{\prime }AP\) 为实对角阵,即 Hermite 矩阵酉相似于实对角阵. 又若 \(A\) 是 \(n\) 阶实对称阵,则存在正交矩阵 \(P\) ,使得 \({P}^{\prime }AP\) 为对角阵,即实对称阵正交相似于对角阵. 上述正交矩阵或酉矩阵 \(P\) 的 \(n\) 个列向量恰为矩阵 \(A\) 的 \(n\) 个两两正交且长度等于 1 的特征向量.
\end{theorem}

\begin{proof}
    只证明\(A\) 是 \(n\) 阶 Hermite 矩阵的情形.

    构造如下的线性变换:
\begin{align*}
    \varphi : \mathbb{C}^{n} & \rightarrow \mathbb{C}^{n} \\ 
    \alpha & \mapsto A\alpha
\end{align*}
取$ \mathbb{C}^n$上的标准内积,$ \varphi$在标准单位列向量$ \{e_1,\cdots,e_n\}$下的表示矩阵为$ A$($ \{e_1,\cdots,e_n\}$为$ \mathbb{C}^n$在标准内积下的标准正交基).由于$ A$是 Hermite 矩阵,因此$ \varphi$ 是自伴随算子.

于是存在$ \mathbb{C}^n$的标准正交基$ \{\alpha_1,\cdots,\alpha_n\}$,使得$ \varphi$ 在该基下的表示矩阵为实对角阵 $ \Lambda$.即有 
\[ (\varphi(\alpha_1), \cdots,\varphi(\alpha_n)) = (\alpha_1, \cdots,\alpha_n)\Lambda = A(\alpha_1, \cdots,\alpha_n) ,\]
令$ P = (\alpha_1, \cdots,\alpha_n)$,则$ P$为酉矩阵($ \{\alpha_1,\cdots,\alpha_n\}$是$ \mathbb{C}^n$在标准内积下的标准正交基),从而有 
\[ P^{-1}A P =\overline{P}'AP =\Lambda .\]
\end{proof}




上述对角阵称为 Hermite (实对称) 矩阵 \(A\) 的酉 (正交) 相似标准型. 对角阵主对角线上的元素就是 \(A\) 的特征值.

现在的问题是实对称阵或 Hermite 矩阵正交相似或酉相似的全系不变量是什么呢?

\begin{corollary}
    实对称 (Hermite) 矩阵的特征值是实对称 (Hermite) 矩阵正交 (酉) 相似的全系不变量.
\end{corollary}
\begin{proof}
    只证明实的情形. 显然正交相似的矩阵有相同的特征值. 另一方面, 由上面的结论知道只需对对角阵证明若它们的特征值相同必正交相似即可. 设

\[
B = \operatorname{diag}\left\{ {{\lambda }_{1},{\lambda }_{2},\cdots ,{\lambda }_{n}}\right\} ,\mathbf{D} = \operatorname{diag}\left\{ {{\lambda }_{{i}_{1}},{\lambda }_{{i}_{2}},\cdots ,{\lambda }_{{i}_{n}}}\right\}
\]

其中 \(\left\{ {{\lambda }_{{i}_{1}},{\lambda }_{{i}_{2}},\cdots ,{\lambda }_{{i}_{n}}}\right\}\) 是 \(\left\{ {{\lambda }_{1},{\lambda }_{2},\cdots ,{\lambda }_{n}}\right\}\) 的一个排列. 由于任一排列可通过若干个对换来实现,因此只要证明对 \(B\) 的第 \(\left( {i,i}\right)\) 元素和第 \(\left( {j,j}\right)\) 元素对换后得到的矩阵与 \(B\) 正交相似即可. 设 \({P}_{ij}\) 是第一类初等矩阵,则 \({P}_{ij}\) 是正交矩阵且 \({P}_{ij}^{\prime } = {P}_{ij}\) ,因此 \({P}_{ij}^{\prime }B{P}_{ij}\) 和 \(B\) 正交相似. 这就是我们所要证明的结论. 
\end{proof}


实对称阵的正交相似理论在实二次型理论中有重要的应用. 从几何的角度看问题, 以三维欧氏空间为例, 就是要在不改变度量的条件下将二次曲面的方程化为标准型. 这也是解析几何中所谓的主轴问题.

\begin{corollary}
    设 \(f\left( x\right) = {x}^{\prime }Ax\) 是 \(n\) 变元实二次型, \({\lambda }_{1},{\lambda }_{2},\cdots ,{\lambda }_{n}\) 是矩阵 \(A\) 的特征值,则 \(f\) 经正交变换可以化为下列标准型:

    \[
    {\lambda }_{1}{y}_{1}^{2} + {\lambda }_{2}{y}_{2}^{2} + \cdots + {\lambda }_{n}{y}_{n}^{2}
    \]
    
    因此, \(f\) 的正惯性指数等于 \(A\) 的正特征值的个数,负惯性指数等于 \(A\) 的负特征值的个数. \(f\) 的秩等于 \(A\) 的非零特征值的个数.        
\end{corollary}


\begin{corollary}
    设 \(f\left( x\right) = {x}^{\prime }Ax\) 是 \(n\) 变元实二次型,则 \(f\) 是正定型当且仅当矩阵 \(A\) 的特征值全是正数, \(f\) 是负定型当且仅当矩阵 \(A\) 的特征值全是负数, \(f\) 是半正定型当且仅当 \(A\) 的特征值全非负, \(f\) 是半负定型当且仅当 \(A\) 的特征值全非正.
\end{corollary}


下面我们通过具体例子来说明对实对称阵 \(A\) ,如何求正交矩阵 \(P\) ,使 \({P}^{\prime }AP\) 是对角阵.





\begin{example}
    求正交矩阵 \(P\) ,使 \({P}^{\prime }{AP}\) 为对角阵,其中
\[ A = \begin{pmatrix}
    4 & 2 & 2 \\ 2 & 4 & 2 \\ 2 & 2 & 4
\end{pmatrix}. \]
\end{example}

\begin{solution}
    先求特征值

\[
\left| {\lambda I - A}\right| =  \begin{vmatrix} \lambda - 4 & - 2 & - 2 \\ - 2 & \lambda - 4 & - 2 \\ - 2 & - 2 & \lambda - 4 \end{vmatrix}= \left( {\lambda - 8}\right) {\left( \lambda - 2\right) }^{2}.
\]

因此, \(A\) 的特征值为 \({\lambda }_{1} = 8,{\lambda }_{2} = {\lambda }_{3} = 2\) . 当 \(\lambda = 8\) 时,求解齐次线性方程组 \(\left( {\lambda I - A}\right) x = \mathbf{0}\) ,得到基础解系 (只有一个向量):

\[
{\eta}_{1} = {\left( 1,1,1\right) }^{\prime }
\]

当 \(\lambda = 2\) 时,求解齐次线性方程组 \(\left( {\lambda I - A}\right) x = \mathbf{0}\) ,得到基础解系 (有两个向量):

\[
{\eta}_{2} = {\left( -1,1,0\right) }^{\prime },{\eta}_{3} = {\left( -1,0,1\right) }^{\prime }.
\]

由于实对称阵属于不同特征值的特征向量必正交, 因此只要对上面两个向量正交化,用 Gram-Schmidt 方法将 \({\eta}_{2},{\eta}_{3}\) 正交化得到

\[
{\xi}_{2} = {\left( -1,1,0\right) }^{\prime },{\xi}_{3} = {\left( -\frac{1}{2}, - \frac{1}{2},1\right) }^{\prime }.
\]
再将 \({\eta}_{1},{\xi}_{2},{\xi}_{3}\) 化为单位向量得到

\[
{v}_{1} = {\left( \frac{1}{\sqrt{3}},\frac{1}{\sqrt{3}},\frac{1}{\sqrt{3}}\right) }^{\prime },{v}_{2} = {\left( -\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}},0\right) }^{\prime },{v}_{3} = {\left( -\frac{1}{\sqrt{6}}, - \frac{1}{\sqrt{6}},\frac{2}{\sqrt{6}}\right) }^{\prime }.
\]

令\[
P = \left( {{v}_{1},{v}_{2},{v}_{3}}\right) = \left( \begin{matrix} \frac{1}{\sqrt{3}} & - \frac{1}{\sqrt{2}} & - \frac{1}{\sqrt{6}} \\ \frac{1}{\sqrt{3}} & \frac{1}{\sqrt{2}} & - \frac{1}{\sqrt{6}} \\ \frac{1}{\sqrt{3}} & 0 & \frac{2}{\sqrt{6}} \end{matrix}\right)
\]

于是
\[ {P}^{\prime }AP =\begin{pmatrix}
    8 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 2
\end{pmatrix}. \]
\end{solution}


\begin{example}
    设 \(A\) 是三阶实对称阵, \(A\) 的特征值为 \(0,3,3\) . 已知属于特征值 0 的特征向量为 \({v}_{1} = {\left( 1,1,1\right) }^{\prime }\) ,又向量 \({v}_{2} = {\left( -1,1,0\right) }^{\prime }\) 是属于特征值 3 的特征向量, 求矩阵 \(A\) .
\end{example}

\begin{solution}
    设 \(A\) 属于特征值 3 的另一特征向量 \({v}_{3} = {\left( {x}_{1},{x}_{2},{x}_{3}\right) }^{\prime }\) 和 \({v}_{1},{v}_{2}\) 都正交,

    则
    
    \[
    \left\{ \begin{array}{l} {x}_{1} + {x}_{2} + {x}_{3} = 0 \\ - {x}_{1} + {x}_{2} = 0 \end{array}\right.
    \]
    
    求出一个非零解 \({v}_{3} = {\left( 1,1, - 2\right) }^{\prime }\) . 因为 \({v}_{1},{v}_{2},{v}_{3}\) 已经两两正交,故只须将 \({v}_{1},{v}_{2},{v}_{3}\) 标准化, 得到
    
    \[
    {\xi}_{1} = \left( \begin{matrix} \frac{1}{\sqrt{3}} \\ \frac{1}{\sqrt{3}} \\ \frac{1}{\sqrt{3}} \end{matrix}\right) ,{\xi}_{2} = \left( \begin{matrix} - \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} \\ 0 \end{matrix}\right) ,{\xi}_{3} = \left( \begin{matrix} \frac{1}{\sqrt{6}} \\ \frac{1}{\sqrt{6}} \\ - \frac{2}{\sqrt{6}} \end{matrix}\right) .
    \]
    
    
    令
    
    \[
    P = \left( {{\xi}_{1},{\xi}_{2},{\xi}_{3}}\right) = \left( \begin{matrix} \frac{1}{\sqrt{3}} & - \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{6}} \\ \frac{1}{\sqrt{3}} & \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{6}} \\ \frac{1}{\sqrt{3}} & 0 & - \frac{2}{\sqrt{6}} \end{matrix}\right) ,B = \left( \begin{array}{lll} 0 & 0 & 0 \\ 0 & 3 & 0 \\ 0 & 0 & 3 \end{array}\right) ,
    \]
    
    则
    
    \[
    A = PB{P}^{\prime } = \left( \begin{matrix} 2 & - 1 & - 1 \\ - 1 & 2 & - 1 \\ - 1 & - 1 & 2 \end{matrix}\right)
    \]
\end{solution}



\begin{example}
    设 \(A\) 是 \(n\) 阶实对称阵且 \({A}^{3} = {I}_{n}\) ,证明: \(A = {I}_{n}\) .
\end{example}
\begin{solution}
    设 \(A\) 的特征值为 \(\lambda\) ,则 \({\lambda }^{3} = 1\) . 因为 \(\lambda\) 是实数,故 \(\lambda = 1\) ,这就是说 \(A\) 的特征值全是 1 . 故存在正交矩阵 \(P\) ,使得 \({P}^{\prime }AP = {I}_{n}\) . 于是 \(A = P{I}_{n}{P}^{\prime } = {I}_{n}\) .
\end{solution}

对上述例题略微进行改变得到.
\begin{example}
    $ A$是$ n$阶方阵,$ A$的所有特征值为实数,并且有$ A^3 = I_n$.求证:$ A = I_n$.
\end{example}
\begin{solution}
    任取$ A$的特征值$ \lambda$,则有$ \lambda\in \mathbb{R}$,并且$ \lambda^3 = 1$,从而$ \lambda = 1$.

    \[ (A^3 - I_n) = (A-I_n)( A^2 + A + I_n) = 0, \]
    $ A$的所有特征值为1,则$ A^2 + A + I_n $的所有特征值为3,从而$ A^2 + A + I_n $可逆.于是得到$ A = I_n$.
\end{solution}





%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%正规算子
\section{ 正规算子}

我们现在来讨论这样一个问题: 如果 \(n\) 维酉空间 \(V\) 上的线性变换 \(\varphi\) 在一组标准正交基下的表示矩阵是对角阵,则 \(\varphi\) 必须满足些什么条件? 设 \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}\) 是 \(V\) 的标准正交基, \(\varphi\) 在这组基下的表示矩阵为

\[
A = \operatorname{diag}\left\{ {{c}_{1},{c}_{2},\cdots ,{c}_{n}}\right\}
\]

则

\[
\varphi \left( {e}_{i}\right) = {c}_{i}{e}_{i}\left( {i = 1,2,\cdots ,n}\right)
\]


即 \(\varphi\) 以 \({c}_{i}\left( {i = 1,2,\cdots ,n}\right)\) 为特征值. \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}\) 恰为 \(\varphi\) 的特征向量. 又记 \({\varphi }^{ * }\) 为 \(\varphi\) 的伴随,则 \({\varphi }^{ * }\) 在这组基下的表示矩阵为

\[
{\overline{A}}^{\prime } = \operatorname{diag}\left\{ {{\bar{c}}_{1},{\bar{c}}_{2},\cdots ,{\bar{c}}_{n}}\right\}
\]

于是, 有

\[
{\overline{A}}^{\prime }A = A{\overline{A}}^{\prime },\varphi {\varphi }^{ * } = {\varphi }^{ * }\varphi .
\]



\begin{definition}
    设 \(\varphi\) 是内积空间 \(V\) 上的线性变换, \({\varphi }^{ * }\) 是其伴随,若 \(\varphi {\varphi }^{ * } = {\varphi }^{ * }\varphi\) , 则称 \(\varphi\) 是 \(V\) 上的正规算子. 为了不引起混淆,我们也称酉空间 (欧氏空间) \(V\) 上的正规算子 \(\varphi\) 为复正规算子 (实正规算子). 一个复矩阵 \(A\) 若适合 \({\overline{A}}^{\prime }A = A{\overline{A}}^{\prime }\) , 则称其为复正规矩阵. 若 \(A\) 是实矩阵且 \({A}^{\prime }A = A{A}^{\prime }\) ,则称其为实正规矩阵.
\end{definition}


\begin{example}
    \begin{enumerate}[(1)]
        \item 自伴随算子是正规算子($ \varphi = {\varphi }^{ * }$).
        \item 正交算子(酉算子)是正规算子.($ \varphi = \varphi^{-1}$).
        \item Hermite矩阵,酉矩阵是复正规矩阵.
        \item 实对称矩阵,正交阵是实正规矩阵.
    \end{enumerate}
\end{example}



\begin{lemma}
    设$ V$是欧氏空间(酉空间),$ \varphi$是$ V$上的线性算子,则$ \varphi$是正规算子当且仅当 $\varphi$ 在某一组(任一组)标准正交基下的表示矩阵为实正规阵(复正规阵).
\end{lemma}
\begin{proof}
    任取$ V$的一组标准正交基,$ \varphi$在这组基下 的表示矩阵为$ A$,则$ \varphi^{*}$在这组基下的表示矩阵为$ A'$(欧氏空间) 或$ {\overline{A}}^{\prime }$(酉空间).

    $ \varphi$ 是正规算子当且仅当$ \varphi \varphi^* = \varphi^* \varphi$当且仅当 $ \varphi \varphi^* $ 与$\varphi^* \varphi$在任一组基下的表示矩阵相同.即$ A A' = A'A$或$ A {\overline{A}}^{\prime } = {\overline{A}}^{\prime }A$.
\end{proof}


我们先证明复正规矩阵 (正规算子) 的特征值和特征向量的一些重要性质.




\begin{lemma}
    设 \(\varphi\) 是内积空间 \(V\) 上的正规算子,则对任意的 \(\alpha \in V\) ,成立
       \[ \parallel \varphi \left( \alpha\right) \parallel = \begin{Vmatrix}{{\varphi }^{ * }\left( \alpha\right) }\end{Vmatrix}
        \]
\end{lemma}
\begin{proof}
    由 \(\varphi\) 的正规性,有
\begin{align*}
    \parallel \varphi \left( \alpha\right) {\parallel }^{2} &= \left( {\varphi \left( \alpha\right) ,\varphi \left( \alpha\right) }\right) = \left( {\alpha,{\varphi }^{ * }\varphi \left( \alpha\right) }\right)\\
&= \left( {\alpha,\varphi {\varphi }^{ * }\left( \alpha\right) }\right) = \left( {{\varphi }^{ * }\left( \alpha\right) ,{\varphi }^{ * }\left( \alpha\right) }\right)\\
&= {\begin{Vmatrix}{\varphi }^{ * }\left( \alpha\right) \end{Vmatrix}}^{2}
\end{align*}
\end{proof}


\begin{lemma}
    设 \(V\) 是 \(n\) 维酉空间, \(\varphi\) 是 \(V\) 上的正规算子.
\begin{enumerate}[(1)]
    \item 向量 \(u\) 是 \(\varphi \) 属于特征值 \(\lambda\) 的特征向量的充分必要条件为 \(u\) 是 \({\varphi }^{ * }\) 属于特征值 \(\bar{\lambda }\) 的特征向量;
    \item  属于 \(\varphi\) 不同特征值的特征向量必正交.
\end{enumerate}
\end{lemma}

\begin{proof}
    (1) 若 \(\lambda\) 是任一数,则 \({\left( \lambda I - \varphi \right) }^{ * } = \bar{\lambda }I - {\varphi }^{ * }\) ,且

\[
\left( {\lambda I - \varphi }\right) \left( {\bar{\lambda }I - {\varphi }^{ * }}\right) = \left( {\bar{\lambda }I - {\varphi }^{ * }}\right) \left( {\lambda I - \varphi }\right) ,
\]

即 \(\lambda I - \varphi\) 也是正规算子. 于是有

\[
\parallel \left( {\lambda I - \varphi }\right) \left( \alpha\right) \parallel = \begin{Vmatrix}{\left( {\bar{\lambda }I - {\varphi }^{ * }}\right) \left( \alpha\right) }\end{Vmatrix}
\]

对一切 \(\alpha \in V\) 成立. 故 \(\left( {\lambda I - \varphi }\right) \left( u\right) = \mathbf{0}\) 当且仅当 \(\left( {\bar{\lambda }I - {\varphi }^{ * }}\right) \left( u\right) = \mathbf{0}\) 成立.

(2) 设 \(\varphi \left( u\right) = \lambda u,\varphi \left( v\right) = \mu v\) 且 \(\lambda \neq \mu\) ,则

\[
\lambda \left( {u,v}\right) = \left( {\lambda u,v}\right) = \left( {\varphi \left( u\right) ,v}\right) = \left( {u,{\varphi }^{ * }\left( v\right) }\right) = \left( {u,\bar{\mu }v}\right) = \mu \left( {u,v}\right) .
\]

因为 \(\lambda \neq \mu\) 故 \(\left( {u,v}\right) = 0\) .
\end{proof}




\begin{theorem}[Schur (舒尔) 定理]
     设 \(V\) 是 \(n\) 维酉空间, \(\varphi\) 是 \(V\) 上的线性算子,则存在 \(V\) 的一组标准正交基,使 \(\varphi\) 在这组基下的表示矩阵为上三角阵.
\end{theorem}
\begin{proof}
    对 \(V\) 的维数 \(n\) 用数学归纳法. 当 \(n = 1\) 时结论显然正确. 设对 \(n - 1\) 维酉空间结论成立. 由于 \(V\) 是复线性空间,因此总存在 \({\varphi }^{ * }\) 的特征值与特征向量, 即有

\[
{\varphi }^{ * }\left( e\right) = {\lambda e}
\]

设 \(W\) 是 \(e\) 张成的一维子空间的正交补空间. 则 \(W\) 是 \({\left( {\varphi }^{ * }\right) }^{ * } = \varphi\) 的不变子空间. 将 \(\varphi\) 限制在 \(W\) 上得到 \(W\) 上的一个线性变换. 而 \(\dim W = n - 1\) , 由归纳假设存在 \(W\) 的一组标准正交基 \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n - 1}}\right\}\) ,使 \(\varphi\) 在 \(W\) 上的限制在这组基下的表示矩阵为上三角阵. 令 \({e}_{n} = \frac{e}{\parallel e\parallel }\) ,则 \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}\) 成为 \(V\) 的一组标准正交基, \(\varphi\) 在这组基下的表示矩阵为上三角阵.
\end{proof}


\begin{corollary}[Schur 定理]
    任一 \(n\) 阶复矩阵均酉相似于一个上三角阵.
\end{corollary}



\begin{theorem}
    设$ \varphi$是酉空间$ V$上的线性算子,则$ \varphi$为正规算子当且仅当$ \varphi$在某组标准正交基下的表示矩阵为复对角阵.
\end{theorem}
\begin{proof}
    充分性:在本节最开始的讨论中已证,下证必要性.

    必要性:由Schur定理可知,存在一组标准正交基$ \left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}$使得$ \varphi$在这组基下的表示矩阵为上三角阵$ A = (a_{ij})_{n\times n}$.则$ \varphi^*$在这组基下的表示矩阵为$ \overline{A}'$为下三角阵.

    即有\[ (\varphi(e_1), \varphi(e_2), \cdots , \varphi(e_n)) = (e_1, e_2,\cdots,e_n)A, \] 
    \[ (\varphi^*(e_1), \varphi^*(e_2), \cdots , \varphi^*(e_n)) = (e_1, e_2,\cdots,e_n)\overline{A}' , \] 
    于是有$ \varphi(e_1) = a_{11}e_1$,由伴随算子的性质知$ \varphi^*(e_1) = \overline{a_{11}}e_1$,但是 
    \[ \varphi^*(e_1) = \overline{a_{11}}e_1+\overline{a_{12}}e_2+ \cdots + \overline{a_{1n}}e_n, \]
    由基向量表示唯一知$ a_{12} = \cdots = a_{1n} = 0$.同理可知$ a_{ij} = 0,\forall i<j$,即$ A$是对角阵.
\end{proof}




\begin{corollary}
    设 \(V\) 是 \(n\) 维酉空间, \(\varphi\) 是 \(V\) 上的正规算子,则 \(V\) 有一组标准正交基,在这组标准正交基下, \(\varphi\) 的表示矩阵是对角阵,且这组基向量恰为 \(\varphi\) 的 \(n\) 个线性无关的特征向量.
\end{corollary}

\begin{corollary}
    设$ A$为复正规阵,则存在酉矩阵$ P$,使得$ \overline{P}'A P $为复对角阵.
\end{corollary}


显而易见, 复正规矩阵的特征值就是复正规矩阵酉相似关系的全系不变量, 即两个复正规矩阵酉相似的充分必要条件是它们具有相同的特征值.



由于酉矩阵是正规矩阵, 因此有下列结论.

\begin{theorem}
    任一 \(n\) 阶酉矩阵$ U$必存在酉矩阵$ P$使得
    \[
    \overline{P}'UP =\operatorname{diag}\left\{ {{c}_{1},{c}_{2},\cdots ,{c}_{n}}\right\}
    \]
    其中 \({c}_{i}\) 为模长等于 1 的复数.    
\end{theorem}

\begin{proof}
    由于与酉矩阵酉相似的矩阵仍是酉矩阵,故 \(\operatorname{diag}\left\{ {{c}_{1},{c}_{2},\cdots ,{c}_{n}}\right\}\) 是酉矩阵,因此 \(\left| {c}_{i}\right| = 1\)(与它共轭转置的乘积为单位阵).
\end{proof}



\begin{theorem}
    设 \(\varphi\) 是 \(n\) 维酉空间 \(V\) 上的线性算子,其所有不同的特征值为 \({\lambda }_{1},{\lambda }_{2},\cdots ,{\lambda }_{k}\) ,则 \(\varphi\) 是正规算子的充分必要条件是

\[
V = {V}_{1} \bot {V}_{2} \bot \cdots \bot {V}_{k}
\]
其中 \({V}_{i}\left( {i = 1,2,\cdots ,k}\right)\) 是属于特征值 \({\lambda }_{i}\) 的特征子空间.
\end{theorem}
\begin{proof}
    必要性:设 \(\varphi\) 是正规算子,则它是个可对角化的线性变换,所以

    \[
    V = {V}_{1} \oplus {V}_{2} \oplus \cdots \oplus {V}_{k}
    \]
    
    由正规算子的性质(属于不同特征值的特征向量必正交)知若 \(i \neq j\) ,则 \({V}_{i} \bot {V}_{j}\) ,所以
    \[
V = {V}_{1} \bot {V}_{2} \bot \cdots \bot {V}_{k}.
\]

充分性:取$ V_i$的标准正交基,拼成$ V$的一组标准正交基,注意到这些基向量都是特征向量,从而$ \varphi$在这组基下的表示矩阵为对角阵,从而$ \varphi$为正规算子,
\end{proof}



\begin{theorem}
    设 \(\varphi\) 是 \(n\) 维欧式空间 \(V\) 上的自伴随算子,其所有不同的特征值为 \({\lambda }_{1},{\lambda }_{2},\cdots ,{\lambda }_{k}\) ,\({V}_{i}\left( {i = 1,2,\cdots ,k}\right)\) 是属于特征值 \({\lambda }_{i}\) 的特征子空间.则
\[
V = {V}_{1} \bot {V}_{2} \bot \cdots \bot {V}_{k}
\]
\end{theorem}



%%%%%%%%%%%%%%%%%%%%----------实正规矩阵
\section{实正规矩阵}


由上一节我们知道,实矩阵 \(A\) 称为正规矩阵若 \(A{A}^{\prime } = {A}^{\prime }A\) . 实正规矩阵的正交相似标准型比复正规矩阵的酉相似标准型要复杂一些, 这是因为任一复矩阵总有特征值与非零特征向量, 而实正规矩阵可能没有实特征值及实特征向量. 为了求得实正规矩阵的正交相似标准型, 我们采用 “几何” 方法.

首先利用欧氏空间 \(V\) 上的正规算子 \(\varphi\) 的极小多项式的不可约分解将 \(V\) 分解成为若干个不变子空间的正交直和,这时要求 \(\varphi\) 限制在每个不变子空间上的极小多项式不超过二次. 这样, 就把问题的研究归结为极小多项式次数不超过二次的正规算子. 因为极小多项式为一次的线性变换就是数量变换, 因此接下去就对极小多项式为二次不可约多项式的正规算子进行讨论. 这样就可以得到实正规矩阵的正交相似标准型.


\begin{lemma}
        设 \(V\) 是 \(n\) 维欧氏空间, \(f\left( x\right)\) 是一个实多项式,若 \(\varphi\) 是 \(V\) 上的正规算子,则 \(f\left( \varphi \right)\) 也是 \(V\) 上的正规算子.
\end{lemma}
\begin{proof}
    设

\[
f\left( x\right) = {a}_{0} + {a}_{1}x + \cdots + {a}_{m}{x}^{m}
\]

则

\[
f\left( \varphi \right) = {a}_{0}I + {a}_{1}\varphi + \cdots + {a}_{m}{\varphi }^{m}
\]

\[
f{\left( \varphi \right) }^{ * } = {a}_{0}I + {a}_{1}{\varphi }^{ * } + \cdots + {a}_{m}{\left( {\varphi }^{ * }\right) }^{m} = f\left( {\varphi }^{ * }\right) ,
\]

由 \(\varphi {\varphi }^{ * } = {\varphi }^{ * }\varphi\) 可知

\[
f\left( \varphi \right) f{\left( \varphi \right) }^{ * } =f(\varphi)f(\varphi^*) = f(\varphi^*)f(\varphi) = f{\left( \varphi \right) }^{ * }f\left( \varphi \right).
\]
\end{proof}

\begin{lemma}
    设 \(\varphi\) 是欧氏空间 \(V\) 上的正规算子, \(f\left( x\right) ,g\left( x\right)\) 是互素的实多项式. 假定 \(u \in \operatorname{Ker}f\left( \varphi \right) ,v \in \operatorname{Ker}g\left( \varphi \right)\) ,则

\[
\left( {u,v}\right) = 0
\]
\end{lemma}
\begin{proof}
    因为 \(f\left( x\right) ,g\left( x\right)\) 互素,故存在实多项式 \(s\left( x\right) ,t\left( x\right)\) ,使

\[
f\left( x\right) s\left( x\right) + g\left( x\right) t\left( x\right) = 1.
\]

于是

\[
f\left( \varphi \right) s\left( \varphi \right) + g\left( \varphi \right) t\left( \varphi \right) = I.
\]
两边作用到$ u$上可以得到
\(u = g\left( \varphi \right) t\left( \varphi \right) \left( u\right)\) ,

\[
\left( {u,v}\right) = \left( {g\left( \varphi \right) t\left( \varphi \right) \left( u\right) ,v}\right) = \left( {t\left( \varphi \right) \left( u\right) ,g{\left( \varphi \right) }^{ * }\left( v\right) }\right) .
\]

由上面的引理 \(g\left( \varphi \right)\) 是正规算子且 \(g\left( \varphi \right) \left( v\right) = \mathbf{0}\) ,由$\parallel\varphi(\alpha)\parallel = \parallel \varphi^*(\alpha)\parallel $ 可得 \(g{\left( \varphi \right) }^{ * }\left( v\right) = \mathbf{0}\) ,.

因此 \(\left( {u,v}\right) = 0\) .
\end{proof}




\begin{theorem}
    设 \(V\) 是 \(n\) 维欧氏空间, \(\varphi\) 是 \(V\) 上的正规算子. 令 \(g\left( x\right)\) 是 \(\varphi\) 的极小多项式,且 \({g}_{1}\left( x\right) ,\cdots ,{g}_{k}\left( x\right)\) 为 \(g\left( x\right)\) 的所有互不相同的首一不可约因子, \({W}_{i} = \operatorname{Ker}{g}_{i}\left( \varphi \right)\),
    
    则 
    \begin{enumerate}[(1)]
        \item \[
g\left( x\right) = {g}_{1}\left( x\right) \cdots {g}_{k}\left( x\right)
\]
且\(\deg {g}_{i}\left( x\right) \leq 2\) 
        \item \(V = {W}_{1} \bot \cdots \bot {W}_{k}\) ;
        \item \({W}_{i}\left( {i = 1,\cdots ,k}\right)\) 是 \(\varphi\) 的不变子空间,且若 \({\varphi }_{i}\) 表示 \(\varphi\) 在 \({W}_{i}\) 上的限制, 则 \({g}_{i}\left( x\right)\) 是 \({\varphi }_{i}\) 的极小多项式且 \({\varphi }_{i}\) 是 \({W}_{i}\) 上的正规算子.
    \end{enumerate}
\end{theorem}

\begin{proof}
    \begin{enumerate}[(1)]
        \item 任取$ V$的一组标准正交基,$ \varphi$在这组标准正交基下的表示矩阵为$ A$,则$ A$是实正规算子.将$ A$看作复矩阵,则$ A$为复正规算子.于是$ A$酉相似于对角阵,从而$ A$可对角化.即$ g(x)$在$ \mathbb{C}$上无重根,从而在$ \mathbb{R}$上无重因式,即有 
    \[ g(x) = {g}_{1}(x)\cdots {g}_{k}(x), \]
    \(g\left( x\right)\) 是实系数多项式, 其不可约因子或为一次式, 或为二次式,.
        \item 令 \({f}_{i}\left( x\right) = g\left( x\right) /{g}_{i}\left( x\right)\) ,则 \({f}_{1}\left( x\right) ,\cdots ,{f}_{k}\left( x\right)\) 互素. 则存在实系数多项式 \({h}_{i}\left( x\right) \left( {i = 1,\cdots ,k}\right)\) ,使

        \[
        {f}_{1}\left( x\right) {h}_{1}\left( x\right) + \cdots + {f}_{k}\left( x\right) {h}_{k}\left( x\right) = 1.
        \]
        令$ x = \varphi$,得到 
        \[ f_1(\varphi)h_1(\varphi)+ \cdots + f_k(\varphi)h_k(\varphi) = I_V.\]
        任取$ \alpha\in V$,两边作用到$ \alpha$可得 
        \[ \alpha = f_1(\varphi)h_1(\varphi)\alpha + \cdots + f_k(\varphi)h_k(\varphi)\alpha, \]
        由于\[ g_i(\varphi)\left( f_i(\varphi)h_i(\varphi) \right) = g(\varphi)h_i(\varphi)(\alpha) = 0, \]
        即$ f_i(\varphi)h_i(\varphi)\in \operatorname{Ker}g_i(\varphi) = W_i $.从而 
        \[ V= W_1+\cdots+ W_k, \]
        $ \forall 1\leq i\neq j\leq k$,$ (g_i(x),g_j(x)) = 1$,由上述引理知$ W_i\bot W_j$,从而 
        \[ V = W_1\bot \cdots \bot W_k .\]
        \item 任取$ w\in W_i = \operatorname{Ker}g_i(\varphi)$,则$ W_i$是$ \varphi$不变子空间,也是$ \varphi^*$不变子空间.因为 
        \[ g_i(\varphi)(\varphi(w)) = \varphi(g_i(\varphi)(w))  = \varphi(0) = 0,\]
        由于$ \varphi\varphi^* = \varphi^*\varphi$,从而得到
        \[ g_i(\varphi)(\varphi^*(w)) = \varphi^*(g_i(\varphi)(w))  = \varphi^*(0) = 0,\]
        作限制$\left. \varphi\right|_{W_i} ,\left. \varphi^*\right|_{W_i}$,根据伴随算子的定义,$ \forall \alpha,\beta \in W_i$,有 
        \[ (\varphi(\alpha),\beta) = (\alpha,\varphi^*(\beta)), \]
        从而有 
        \[ (\left. \varphi\right|_{W_i}(\alpha),\beta) = (\alpha,\left. \varphi^*\right|_{W_i}(\beta)),\]
        即$ (\left. \varphi\right|_{W_i})^* = \left. \varphi^*\right|_{W_i}$.从而 
        \[ \left. \varphi\right|_{W_i} (\left. \varphi\right|_{W_i} )^* = \left. \varphi\right|_{W_i} \left. \varphi^*\right|_{W_i}  = \left. \varphi^*\right|_{W_i} \left. \varphi\right|_{W_i}  =   (\left. \varphi\right|_{W_i} )^*\left. \varphi\right|_{W_i} ,\]
        于是$ \left. \varphi\right|_{W_i} $是正规算子.

        因为$ W_i = \operatorname{Ker}g_i(\varphi)$, 从而$ \left. \varphi\right|_{W_i} $适合$ g_i(\varphi)$.

        于是$ \left. \varphi\right|_{W_i} $的极小多项式整除$ g_i(x)$,由$ g_i(x)$的不可约性知极小多项式为$ g_i(x)$.
    \end{enumerate}
\end{proof}

接下去我们要讨论极小多项式是二次不可约多项式的实正规算子的表示矩阵, 先对比较简单的情形即极小多项式为 \({x}^{2} + 1\) 的正规算子进行讨论,再过渡到一般情形.


\begin{lemma}
    设 \(V\) 是 \(n\) 维欧氏空间, \(\varphi\) 是 \(V\) 上的正规算子,极小多项式为 \(g(x) =x^{2} + 1\), 任取$ 0\neq v \in V$,$ u= \varphi(v)$,则
    \[ \parallel u \parallel = \parallel v\parallel,(u,v) = 0,\]
    并且 
    \[ (\varphi(u),\varphi(v)) = (u,v)\begin{pmatrix}
        0&1\\
        -1&0
    \end{pmatrix} ,(\varphi^*(u),\varphi^*(v)) = (u,v)\begin{pmatrix}
        0&-1\\
        1&0
    \end{pmatrix}.\]
\end{lemma}

\begin{proof}
    由 \(\varphi \left( u\right) = {\varphi }^{2}\left( v\right) = - v\) ,得
\begin{align*}
    0& = \parallel \varphi \left( v\right) - u{\parallel }^{2} + \parallel \varphi \left( u\right) + v{\parallel }^{2}\\
    &    = \parallel \varphi \left( v\right) {\parallel }^{2} - 2\left( {\varphi \left( v\right) ,u}\right) + \parallel u{\parallel }^{2} + \parallel \varphi \left( u\right) {\parallel }^{2} + 2\left( {\varphi \left( u\right) ,v}\right) + \parallel v{\parallel }^{2}.
\end{align*}

    因为 \(\varphi\) 是正规算子,由于 \(\parallel \varphi \left( v\right) {\parallel }^{2} = {\begin{Vmatrix}{\varphi }^{ * }\left( v\right) \end{Vmatrix}}^{2},\parallel \varphi \left( u\right) {\parallel }^{2} = {\begin{Vmatrix}{\varphi }^{ * }\left( u\right) \end{Vmatrix}}^{2}\) .
    
    故
    \begin{align*}
         0 & = {\parallel {\varphi }^{ * }\left( v\right) \parallel }^{2} + 2\left( {{\varphi }^{ * }\left( v\right) ,u}\right) + \parallel u{\parallel }^{2} + {\parallel {\varphi }^{ * }\left( u\right) \parallel }^{2} - 2\left( {{\varphi }^{ * }\left( u\right) ,v}\right) + {\parallel v\parallel }^{2} \\
         &= {\begin{Vmatrix}{\varphi }^{ * }\left( v\right) + u\end{Vmatrix}}^{2} + {\begin{Vmatrix}{\varphi }^{ * }\left( u\right) - v\end{Vmatrix}}^{2}.
    \end{align*}


    于是 \({\varphi }^{ * }\left( v\right) = - u,{\varphi }^{ * }\left( u\right) = v\) . 又
    
    \[
    \left( {v,u}\right) = \left( {{\varphi }^{ * }\left( u\right) ,u}\right) = \left( {u,\varphi \left( u\right) }\right) = \left( {u, - v}\right) = - \left( {v,u}\right) ,
    \]
    
    因此 \(\left( {v,u}\right) = 0,v \bot u\) . 最后
    
    \[
    \parallel v{\parallel }^{2} = \left( {{\varphi }^{ * }\left( u\right) ,v}\right) = \left( {u,\varphi \left( v\right) }\right) = \left( {u,u}\right) = \parallel u{\parallel }^{2}.
    \]
\end{proof}



\begin{lemma}
    设 \(V\) 是 \(n\) 维欧氏空间, \(\varphi\) 是 \(V\) 上的正规算子且 \(\varphi\) 的极小多项式为 \(g\left( x\right) = {\left( x - a\right) }^{2} + {b}^{2}\) ,其中 \(a,b\) 都是实数且 \(b \neq 0\) . 设 \(v \in V,u = {b}^{-1}\left( {\varphi  - aI}\right) \left( v\right)\) , 则 \(\parallel u\parallel = \parallel v\parallel ,u \bot v\) ,且

    \[
    \varphi \left( v\right) = av + bu,\varphi \left( u\right) = - bv + au
    \]
    
    \[
    {\varphi }^{ * }\left( v\right) = av - bu,{\varphi }^{ * }\left( u\right) = bv + au.
    \]
\end{lemma}

\begin{proof}
    令 \(\psi = {b}^{-1}\left( {\varphi - aI}\right)\) ,则 \({\psi }\) 适合多项式 \({x}^{2} + 1\) ,且 \(u = {\psi }\left( v\right) ={b}^{-1}({\varphi - aI})(v) \) .由上述引理知
    \[  \]

    由上述引理知\(\parallel u\parallel = \parallel v\parallel ,u \bot v\) ,并且$ \psi$的表示矩阵为
    \[ \begin{pmatrix}
        0&1\\
        -1&0
    \end{pmatrix}, \]
    $ \psi^*$的表示矩阵为\[ \begin{pmatrix}
        0&-1\\
        1&0
    \end{pmatrix} ,\]
    反之,$ \varphi = a I+b\psi,\varphi^* = a I+b\psi^*$,从而 $ \varphi,\varphi^*$的表示矩阵分别为
    \[ \begin{pmatrix}
        a&b\\
        -b&a
    \end{pmatrix},\begin{pmatrix}
        a&-b\\
        b&a
    \end{pmatrix} .\]
\end{proof}


\begin{theorem}
    设 \(\varphi\) 是 \(n\) 维欧氏空间 \(V\) 上的正规算子, \(\varphi\) 的极小多项式为 \(g\left( x\right) = {\left( x - a\right) }^{2} + {b}^{2}\) ,其中 \(a,b\) 是实数且 \(b \neq 0\) ,则存在 \(s\) ,使 \(g{\left( x\right) }^{s}\) 是 \(\varphi\) 的特征多项式且存在 \(V\) 的 \(s\) 个二维子空间 \({V}_{1},\cdots ,{V}_{s}\) ,使

\[
V = {V}_{1} \bot \cdots \bot {V}_{s}
\]

每个 \({V}_{i}\) 有标准正交基 \(\left\{ {{u}_{i},{v}_{i}}\right\}\) ,且

\[
\varphi \left( {u}_{i}\right) = a{u}_{i} - b{v}_{i},\varphi \left( {v}_{i}\right) = b{u}_{i} + a{v}_{i}.
\]
\end{theorem}
\begin{proof}
    对 \(V\) 的维数 \(n\) 进行归纳. 当 \(n = 0\) 时,结论是平凡的. 当 \(n = 1\) 时,任取 \(V\) 中的非零向量 \(v\) ,设 \(\varphi \left( v\right) = cv\) ,其中 \(c\) 是实数,则 \(c\) 是 \(\varphi\) 的特征值. 因此 \(c\) 必须适合 \(\varphi\) 的极小多项式 \(g\left( x\right)\) ,但 \(g\left( c\right) = {\left( c - a\right) }^{2} + {b}^{2} > 0\) ,这个矛盾说明 \(n = 1\) 的情形不可能发生. 设维数小于 \(n\) 时结论已成立,现证明 \(n\) 维欧氏空间的情形.

任取 \(V\) 中长度等于 1 的向量 \({v}_{1}\) ,令 \({u}_{1} = {b}^{-1}\left( {\varphi  - aI}\right) \left( {v}_{1}\right)\) ,则 \({v}_{1},{u}_{1}\) 是两个长度等于 1 的正交向量. 令 \({V}_{1}\) 是由 \({v}_{1},{u}_{1}\) 张成的子空间,则

\[
\varphi \left( {u}_{1}\right) = a{u}_{1} - b{v}_{1},\varphi \left( {v}_{1}\right) = b{u}_{1} + a{v}_{1}
\]

\[
{\varphi }^{ * }\left( {u}_{1}\right) = a{u}_{1} + b{v}_{1},{\varphi }^{ * }\left( {v}_{1}\right) = - b{u}_{1} + a{v}_{1}.
\]

因此 \({V}_{1}\) 是 \(\varphi\) 和 \({\varphi }^{ * }\) 的不变子空间. 令 \(W = {V}_{1}^{ \bot }\) ,从而 \(W\) 是 \(\varphi\) 和 \({\varphi }^{ * }\) 的不变子空间. 因为 \(\dim W = n - 2\) ,由归纳假设存在 \(s - 1\) 个二维子空间 \({V}_{2},\cdots ,{V}_{s}\) ,使

\[
W = {V}_{2} \bot \cdots \bot {V}_{s}
\]

且每个 \({V}_{i}\left( {i = 2,\cdots ,s}\right)\) 有标准正交基 \(\left\{ {{u}_{i},{v}_{i}}\right\}\) 使得表示矩阵为\[ \begin{pmatrix}
    a&b\\
    -b&a
\end{pmatrix}, \] 因此

\[
V = {V}_{1} \bot {V}_{2} \bot \cdots \bot {V}_{s}
\]

且 \(\varphi\) 在标准正交基 \(\left\{ {{u}_{1},{v}_{1},{u}_{2},{v}_{2},\cdots ,{u}_{s},{v}_{s}}\right\}\) 下的表示矩阵为分块对角阵:

\[
A = \operatorname{diag}\left\{ {{A}_{1},{A}_{2},\cdots ,{A}_{s}}\right\}
\]

其中

\[
{A}_{i} = \begin{pmatrix} a & b \\ - b & a \end{pmatrix}
\]
显然 \(A\) 的特征多项式为 \(g{\left( x\right) }^{s}\) .

\end{proof}
将上面的讨论综合起来, 就可得到这一节的主要结论.


\begin{theorem}
    设 \(V\) 是 \(n\) 维欧氏空间, \(\varphi\) 是 \(V\) 上的正规算子,则存在一组标准正交基,使 \(\varphi\) 在这组基下的表示矩阵为下列分块对角阵:

    \[
    \operatorname{diag}\left\{ {{A}_{1},\cdots ,{A}_{r},{c}_{{2r} + 1},\cdots ,{c}_{n}}\right\}
    \]
    
    其中 \({c}_{j}\left( {j = {2r} + 1,\cdots ,n}\right)\) 是实数, \({A}_{i}\) 为形如
    
    \[
    \begin{pmatrix} {a}_{i} & {b}_{i} \\ - {b}_{i} & {a}_{i} \end{pmatrix}
    \]
    
    的二阶实矩阵.
\end{theorem}
\begin{proof}
    由前面定理可知

\[
V = {W}_{1} \bot {W}_{2} \bot \cdots \bot {W}_{k}
\]

其中 \({W}_{i} = \operatorname{Ker}{g}_{i}\left( \varphi \right) ,{g}_{i}\left( x\right)\) 是次数不超过 2 的多项式,并且 \(\varphi\) 在 \({W}_{i}\) 上的限制 \({\varphi }_{i}\) 是 \({W}_{i}\) 上的正规算子,其极小多项式是 \({g}_{i}\left( x\right)\) . 对每个 \({W}_{i}\) ,若 \({g}_{i}\left( x\right)\) 是二次多项式, 则由上述定理 知 \({W}_{i}\) 可分解为若干个二维子空间的正交直和. 若 \({g}_{i}\left( x\right) = x - {c}_{i}\) , 则 \({\varphi }_{i} - {c}_{i}I = \mathbf{0}\) ,即 \({\varphi }_{i} = {c}_{i}I\) . 由此即可得到所需结论.
\end{proof}

\[
    \operatorname{diag}\left\{ {{A}_{1},\cdots ,{A}_{r},{c}_{{2r} + 1},\cdots ,{c}_{n}}\right\}
    \]
    
    其中 \({c}_{j}\left( {j = {2r} + 1,\cdots ,n}\right)\) 是实数, \({A}_{i}\) 为形如
    
    \[
    \begin{pmatrix} {a}_{i} & {b}_{i} \\ - {b}_{i} & {a}_{i} \end{pmatrix}
    \]
上式就是实正规矩阵的正交相似标准型. 在不计对角线上块的次序的意义下, 实正规矩阵的正交相似标准型是唯一确定的. 因此, 实正规矩阵的特征值是正交相似关系的全系不变量.

利用实正规矩阵的正交相似标准型, 我们立即可得到正交矩阵的正交相似标准型.


\begin{corollary}
    设 \(A\) 是 \(n\) 阶正交矩阵,则 \(A\) 正交相似于下列分块对角阵:

\[
\operatorname{diag}\left\{ {{A}_{1},\cdots ,{A}_{r};1,\cdots ,1; - 1,\cdots , - 1}\right\}
\]

其中

\[
{A}_{i} = \left( \begin{matrix} \cos {\theta }_{i} & \sin {\theta }_{i} \\ - \sin {\theta }_{i} & \cos {\theta }_{i} \end{matrix}\right) ,i = 1,\cdots ,r.
\]
\end{corollary}
\begin{proof}
    由于正交矩阵是正规矩阵,由定理知道 \(A\) 必正交相似于

\[
\operatorname{diag}\left\{ {{A}_{1},\cdots ,{A}_{r};{c}_{{2r} + 1},\cdots ,{c}_{n}}\right\} .
\]

又由正交矩阵的性质知 \(\left| {c}_{i}\right| = 1\left( {i = {2r} + 1,\cdots ,n}\right)\) . 另一方面,设

\[
{A}_{i} = \left( \begin{matrix} {a}_{i} & {b}_{i} \\ - {b}_{i} & {a}_{i} \end{matrix}\right)
\]

则 \({a}_{i}^{2} + {b}_{i}^{2} = 1\) ,故可设 \({a}_{i} = \cos {\theta }_{i},{b}_{i} = \sin {\theta }_{i}\) .
\end{proof}

设 \(A\) 是 \(n\) 阶实方阵,若 \(A\) 适合下列条件:
\[
{A}^{\prime } = - A
\]
则称 \(A\) 是实反对称阵或实斜对称阵. 由于 \(A{A}^{\prime } = - {A}^{2} = {A}^{\prime }A\) ,故实反对称阵是正规矩阵. 若 \(P\) 是正交矩阵,则
\[
{\left( {P}^{\prime }AP\right) }^{\prime } = {P}^{\prime }{A}^{\prime }P = - {P}^{\prime }AP.
\]
因此, 反对称性在正交相似下保持不变. 下面是实反对称阵的正交相似标准型定理.
\begin{theorem}
    设 \(A\) 是实反对称阵,则 \(A\) 正交相似于下列分块对角阵:

\[
\operatorname{diag}\left\{ {{B}_{1},\cdots ,{B}_{r};0,\cdots ,0}\right\}
\]

其中

\[
{B}_{i} = \left( \begin{matrix} 0 & {b}_{i} \\ - {b}_{i} & 0 \end{matrix}\right) ,i = 1,\cdots ,r.
\]
\end{theorem}
\begin{proof}
    设 \(A\) 正交相似于

\[
\operatorname{diag}\left\{ {{B}_{1},\cdots ,{B}_{r};{c}_{{2r} + 1},\cdots ,{c}_{n}}\right\}
\]

由 \({B}^{\prime } = - B\) 即得 \({c}_{i} = 0\left( {i = {2r} + 1,\cdots ,n}\right)\) . 再由 \({B}_{i}^{\prime } = - {B}_{i}\) 知道, \({B}_{i}\) 必具有定理所需之形状.
\end{proof}


\begin{corollary}
    实反对称阵的秩必是偶数, 且其实特征值必为 0 , 虚特征值为纯虚数.
\end{corollary}


%%%%%%%%%%%%%%%%%%%%%%%%%%% --------谱
\section{谱}

设 \(V\) 是 \(n\) 维酉空间, \(\varphi\) 是 \(V\) 上的正规算子, \(\varphi\) 全体不同的特征值设为 \({\lambda }_{1},{\lambda }_{2},\cdots ,{\lambda }_{k}\) . 我们知道,存在 \(V\) 的一组标准正交基,使得 \(\varphi\) 在这组基下的表示矩阵为对角阵

\[
A = \operatorname{diag}\left\{ {{\lambda }_{1},\cdots ,{\lambda }_{1};{\lambda }_{2},\cdots ,{\lambda }_{2};\cdots ;{\lambda }_{k},\cdots ,{\lambda }_{k}}\right\}
\]

假定特征值 \({\lambda }_{i}\) 的重数等于 \({r}_{i}\) ,则在分解式

\[
V = {W}_{1} \bot {W}_{2} \bot \cdots \bot {W}_{k}
\]

中, \({W}_{i}\) 是 \(\varphi\) 的特征子空间且维数等于 \({r}_{i}\) . 若记 \({D}_{i}\) 为如下对角阵

\[
{D}_{i} = \operatorname{diag}\{ 0,\cdots ,0;\cdots ;1,\cdots ,1;\cdots ;0,\cdots ,0\}
\]

即主对角元有 \({r}_{i}\) 个 1,其余都是 0 的对角阵,则

\[
A = {\lambda }_{1}{D}_{1} + {\lambda }_{2}{D}_{2} + \cdots + {\lambda }_{k}{D}_{k}
\]

诸 \({D}_{i}\) 适合条件 \({D}_{i}^{2} = {D}_{i},{D}_{i}{D}_{j} = \mathbf{O}\left( {i \neq j}\right) ,{D}_{1} + {D}_{2} + \cdots + {D}_{k} = {I}_{n}\) .

对实对称阵也有类似的结论. 如果把上面的结论 “翻译” 成几何语言就是下面的谱分解定理\footnote{全体特征值称为谱.}. 我们将给出一个用 “几何” 方法的证明.


\begin{theorem}[谱分解定理]
    设 \(V\) 是有限维内积空间, \(\varphi\) 是 \(V\) 上的线性算子,当 \(V\) 是酉空间时 \(\varphi\) 为正规算子; 当 \(V\) 是欧氏空间时 \(\varphi\) 为自伴随算子. \({\lambda }_{1},{\lambda }_{2},\cdots ,{\lambda }_{k}\) 是 \(\varphi\) 全体不同的特征值, \({W}_{i}\) 为 \(\varphi\) 属于 \({\lambda }_{i}\) 的特征子空间,则 \(V\) 是 \({W}_{i}\left( {i = 1,2,\cdots ,k}\right)\) 的正交直和. 这时若设 \({E}_{i}\) 是 \(V\) 到 \({W}_{i}\) 上的正交投影,则 \(\varphi\) 有下列分解式:
    \begin{align*}
        \varphi = \lambda_1 E_1 + \lambda_2 E_2 + \cdots + \lambda_k E_k.
    \end{align*}
\end{theorem}

\begin{proof}
    由前面结论知道

\[
V = {W}_{1} \bot {W}_{2} \bot \cdots \bot {W}_{k}
\]

又因为 \({E}_{i}\) 是 \(V \rightarrow {W}_{i}\) 的正交投影,故

\begin{align*}
    I = E_1 + E_2 + \cdots + E_k,
\end{align*}

注意 \(\varphi E_i = \lambda_i E_i\)，这是由于任取$ v\in V$,$ E_i(v)\in W_i = \operatorname{Ker}(\varphi - \lambda_i I_V)$,即 
\[ (\varphi - \lambda_i I_V)(E_i(v)) = 0, \]
即 \[ \varphi(E_i(v)) =\lambda_i E_i(v) , \]
从而\(\varphi E_i = \lambda_i E_i\).

于是
\begin{align*}
\varphi &= \varphi E_1 + \varphi E_2 + \cdots + \varphi E_k \\
&= \lambda_1 E_1 + \lambda_2 E_2 + \cdots + \lambda_k E_k.
\end{align*}

\end{proof}


谱分解定理有许多重要的应用, 我们下面择要介绍其应用.


\begin{lemma}
若 $$f_j(x) = \prod_{i \neq j} \frac{1}{\lambda_j - \lambda_i}(x - \lambda_i),$$则 \(E_j = f_j(\varphi)\)。
\end{lemma}
\begin{proof}
当 \(i \neq j\) 时 \(E_i E_j = 0\),并且有$ E_i^2 = E_i$，故
\begin{align*}
\varphi^2 = \lambda_1^2 E_1 + \lambda_2^2 E_2 + \cdots + \lambda_k^2 E_k.
\end{align*}
同理不难证明
\begin{align*}
\varphi^n = \lambda_1^n E_1 + \lambda_2^n E_2 + \cdots + \lambda_k^n E_k
\end{align*}
对一切正整数 \(n\) 成立。若设
\begin{align*}
f(x) = a_0 + a_1 x + \cdots + a_n x^n,
\end{align*}

则
\begin{align*}
f(\varphi) &= a_0 I + a_1 \varphi + \cdots + a_n \varphi^n \\
&= a_0 (\sum_{i=1}^k E_i) + a_1 (\sum_{i=1}^k \lambda_i E_i) + \cdots + a_n (\sum_{i=1}^k \lambda_i^n E_i) \\
&= \sum_{i=1}^k f(\lambda_i) E_i.
\end{align*}
由 \(f_j(\lambda_j) = 1\)，\(f_j(\lambda_i) = 0\)（ \(j \neq i\)）即得 \(f_j(\varphi) = E_j\)。
\end{proof}


\begin{theorem}
    设 \(\varphi\) 是酉空间 \(V\) 上的线性算子，则 \(\varphi\) 是正规其子的充分必要条件是存在复系数多项式\(f(x)\)，使 \(\varphi^* = f(\varphi)\)。    
\end{theorem}

\begin{proof}
    充分性:若存在复系数多项式\(f(x)\)，使 \(\varphi^* = f(\varphi)\)，则 \(\varphi \varphi^* = \varphi^* \varphi\)，即 \(\varphi\) 是正规算子。
    
    必要性:若 \(\varphi\) 是正规算子，则 \(\varphi\) 存在谱分解：
\[
\varphi = \lambda_1 E_1 + \lambda_2 E_2 + \cdots + \lambda_k E_k.
\]
注意到\(E_i\) 是自伴随算子，故
\[
\varphi^* = \overline{\lambda}_1 E_1 + \overline{\lambda}_2 E_2 + \cdots + \overline{\lambda}_k E_k.
\]
采用与上述引理 相同的记号，令\(f(x) = \sum_{j=1}^k \overline{\lambda}_j f_j(x)\)，则
\[
f(\varphi) = \sum_{j=1}^k \overline{\lambda}_j f_j(\varphi) = \sum_{j=1}^k \overline{\lambda}_j E_j = \varphi^*.
\]
\end{proof}


\begin{definition}
    设 \(\varphi\) 是内积空间 \(V\) 上的自伴随算子,若对任意的非零向量 \(\alpha \in V\) ,总有 \(\left( {\varphi \left( \alpha\right) ,\alpha}\right) > 0\left( {\left( {\varphi \left( \alpha\right) ,\alpha}\right) \geq 0}\right)\) ,则称 \(\varphi\) 为正定 (半正定) 自伴随算子.
\end{definition}



容易证明 \(\varphi\) 是正定自伴随算子当且仅当 \(\varphi\) 在 \(V\) 的一组标准正交基下的表示矩阵是正定 Hermite 矩阵（酉空间时）或正定实对称阵(欧氏空间时); \(\varphi\) 是半正定自伴随算子当且仅当 \(\varphi\) 在 \(V\) 的一组标准正交基下的表示矩阵是半正定 Hermite 矩阵（酉空间时）或半正定实对称阵（欧氏空间时）。

虽然下面一个定理用标准型很容易证明，但是用谱分解来证明亦不失为一个好方法。

\begin{theorem}
    设 \(\varphi\) 是西空间 \(V\) 上的正规算子。若 \(\varphi\) 的特征值全是实数，则 \(\varphi\) 是自伴随算子；若 \(\varphi\) 的特征值全是正实数，则 \(\varphi\) 是正定自伴随算子；若 \(\varphi\) 的特征值全是正实数，则 \(\varphi\) 是正定自伴随算子；若 \(\varphi\) 的是酉算子。
\end{theorem}
\begin{proof}
    设 \(\varphi\) 的谱分解为
\begin{align*}
\varphi = \lambda_1 E_1 + \lambda_2 E_2 + \cdots + \lambda_k E_k,
\end{align*}
则
\begin{align*}
\varphi^* = \overline{\lambda}_1 E_1 + \overline{\lambda}_2 E_2 + \cdots + \overline{\lambda}_k E_k.
\end{align*}
若 \(\varphi\) 的特征值全是实数，则 \(\varphi^* = \varphi,\) 即 \(\varphi\) 是自伴随算子。若 \(\lambda_i\) 全是非负实数，任取非零向量 \(\alpha \in V\)，有
\begin{align*}
\alpha &= E_1(\alpha) + E_2(\alpha) + \cdots + E_k(\alpha), \\
\varphi(\alpha) &= \lambda_1 E_1(\alpha) + \lambda_2 E_2(\alpha) + \cdots + \lambda_k E_k(\alpha),
\end{align*}
从而
\begin{align*}
(\varphi(\alpha), \alpha) = \lambda_1 \| E_1(\alpha) \|^2 + \lambda_2 \| E_2(\alpha) \|^2 + \cdots + \lambda_k \| E_k(\alpha) \|^2 \geq 0.
\end{align*}
同理，若特征值全是正实数，则 \(\varphi\) 是正定自伴随算子。最后若 \(|\lambda_i| = 1\)，则
\begin{align*}
\varphi \varphi^* &= \lambda_1 \overline{\lambda}_1 E_1 + \lambda_2 \overline{\lambda}_2 E_2 + \cdots + \lambda_k \overline{\lambda}_k E_k \\
&= |\lambda_1|^2 E_1 + |\lambda_2|^2 E_2 + \cdots + |\lambda_k|^2 E_k \\
&=  I,
\end{align*}
即$ \varphi$是酉算子.
\end{proof}


\begin{theorem}
    设 \(V\) 是有限维内积空间, \(\varphi\) 是 \(V\) 上的半正定自伴随算子,则存在 \(V\) 上唯一的半正定自伴随算子 \(\psi\) ,使 \({\psi }^{2} = \varphi\) .
\end{theorem}

\begin{proof}
 设 \(\varphi\) 的谱分解式为
\begin{align*}
\varphi = \lambda_1 E_1 + \lambda_2 E_2 + \cdots + \lambda_k E_k.
\end{align*}
令 \(d_i = \sqrt{\lambda_i} (i = 1, 2, \cdots, k)\)，则
\begin{align*}
\psi = d_1 E_1 + d_2 E_2 + \cdots + d_k E_k
\end{align*}
适合 \(\psi^2 = \varphi\) 且 \(\psi\) 也是半正定自伴随算子。

现设 \(\theta\) 是 \(V\) 上的半正定自伴随算子且 \(\theta^2 = \varphi\)，我们要证明 \(\theta = \psi\)，令
\[ \theta = b_1 F_1 + b_2 F_2 + \cdots + b_r F_r \]

是 \(\theta\) 的谱分解，其中 \(F_1\) 是正交投影算子且 \(b_i\) 为非负实数。由 \(\theta^2 = \varphi\) 得
\begin{align*}
\varphi = b_1^2 F_1 + b_2^2 F_2 + \cdots + b_r^2 F_r.
\end{align*}
故 \(b_i^2\) 是 \(\varphi\) 的特征值而 \(b_i\) 互不相同，因此 \(r = k_i ,b_i = d_i\) (这里允许差一个次序)。注意到 \(E_i(V)\) 及 \(F_i(V)\) 都是 \(\varphi\) 的关于特征值 \(\lambda_i\) 的特征子空间，因此 \(F_i = E_i\)，这就证明了 \(\theta = \psi\)。
\end{proof}

\begin{corollary}
    设 \(A\) 是半正定实对称 (Hermite) 矩阵,则必存在唯一的半正定实对称 (Hermite) 矩阵 \(B\) ,使 \(A = {B}^{2}\) .
\end{corollary}


\begin{theorem}[极分解]
    设 \(V\) 是 \(n\) 维酉空间 (欧氏空间), \(\varphi\) 是 \(V\) 上的任一线性算子,则存在 \(V\) 上的酉算子 (正交算子) \(\omega\) 以及 \(V\) 上的半正定自伴随算子 \(\mathbf{\psi }\) ,使 \(\varphi  = \omega\mathbf{\psi }\) , 其中 \(\psi\) 是唯一的,并且若 \(\varphi\) 是非异线性算子,则 \(\omega\) 也唯一.
\end{theorem}

\begin{proof}
    若已有 \(\varphi = {\omega \psi }\) ,其中 \(\omega\) 为酉算子, \(\psi\) 为半正定自伴随算子,则

\[
{\varphi }^{ * } = {\psi }^{ * }{\omega }^{ * } = \psi {\omega }^{ * }
\]

\[
{\varphi }^{ * }\varphi = \psi {\omega }^{ * }{\omega \psi } = {\psi }^{2}
\]
由定义容易验证 \({\varphi }^{ * }\varphi\) 是半正定自伴随算子,故由前面定理知, \(\psi\) 被 \(\varphi\) 唯一确定.

现来证明存在性. 令 \(\psi\) 是上面定理中的 \(\psi\) 且使 \({\psi }^{2} = {\varphi }^{ * }\varphi\) . 若 \(\varphi\) 是非异线性变换,则 \(\psi\) 也是非异的. 事实上,这时

\begin{align}\label{equation:9.2}
    \left( {\psi \left( v\right) ,\psi \left( v\right) }\right) = \left( {{\psi }^{2}\left( v\right) ,v}\right) = \left( {{\varphi }^{ * }\varphi \left( v\right) ,v}\right) = \left( {\varphi \left( v\right) ,\varphi \left( v\right) }\right)
\end{align}


对一切 \(v \in V\) 成立. 显然从 \(\varphi\) 非异即可推出 \(\psi\) 也非异. 这时可令 \(\omega = \varphi {\psi }^{-1}\) ,只需证明 \(\omega\) 是酉算子 (正交算子) 即可. 注意到

\[
{\omega}^{ * } = {\left( \varphi {\mathbf{\psi }}^{-1}\right) }^{ * } = {\left( {\mathbf{\psi }}^{-1}\right) }^{ * }{\varphi }^{ * } = {\left( {\mathbf{\psi }}^{ * }\right) }^{-1}{\varphi }^{ * } = {\mathbf{\psi }}^{-1}{\varphi }^{ * },
\]

\[
{\omega}^{ * }\omega = {\mathbf{\psi }}^{-1}{\varphi }^{ * }\varphi {\mathbf{\psi }}^{-1} = {\mathbf{\psi }}^{-1}{\mathbf{\psi }}^{2}{\mathbf{\psi }}^{-1} = I.
\]

因此 \(\omega\) 是酉算子 (正交算子).

若 \(\varphi\) 不是非异线性变换,现来定义 \(\omega\) . 设 \(W = \operatorname{Im}\mathbf{\psi },{W}^{ \bot }\) 是其正交补空间. 定义 \(W = \operatorname{Im}\psi \rightarrow \operatorname{Im}\varphi\) 的映射 \(\eta\) 如下: 若 \(\mathbf{\psi }\left( u\right) \in W\) ,则

\[
\eta \left( {\psi \left( u\right) }\right) = \varphi \left( u\right)
\]

这时我们必须验证 \(\eta\) 定义的合理性. 即若 \(\psi \left( u\right) = \psi \left( v\right)\) ,必须 \(\varphi \left( u\right) = \varphi \left( v\right)\) . 由\eqref{equation:9.2} 式可知对任意的 \(\alpha \in V,\parallel \psi \left( \alpha\right) {\parallel }^{2} = \parallel \varphi \left( \alpha\right) {\parallel }^{2}\) ,因此 \(\psi \left( {u - v}\right) = \mathbf{0}\) 当且仅当 \(\varphi \left( {u - v}\right) = \mathbf{0}\) . 这表明 \(\eta\) 是一个合理定义的映射. 又 \(\eta\) 显然是线性的.

再定义 \({W}^{ \bot } \rightarrow {\left( \operatorname{Im}\varphi \right) }^{ \bot }\) 的映射 \(\xi\) : 由 \eqref{equation:9.2} 式可知 \(\varphi\) 与 \(\psi\) 的核空间相同, 故像空间的维数相等. 于是 \({W}^{ \bot }\) 与 \({\left( \operatorname{Im}\varphi \right) }^{ \bot }\) 的维数相同,故必存在一个保持内积的同构,这个同构记为 \(\xi\) . 由于 \(V = W \oplus {W}^{ \bot }\) ,因此 \(V\) 中任一向量 \(v\) 均可唯一地表示为

\[
v = w + {w}^{\prime }
\]

其中 \(w \in W,{w}^{\prime } \in {W}^{ \bot }\) . 令

\[
\omega\left( v\right) = \eta\left( w\right) + \xi\left( {w}^{\prime }\right)
\]

不难看出 \(\omega\) 是 \(V\) 上的线性变换且若设 \(w = \mathbf{\psi }\left( u\right)\) ,则


\begin{align*}
    (\omega(v), \omega(v)) &= (\eta(w) + \xi(w'), \eta(w) + \xi(w') ) \\
    &= (\varphi(w) + \xi(w'), \varphi(u) + \xi(w') ) \\
    &= (\varphi(w), \varphi(u)) + (\xi(w'), \xi(w') ) \\
    &= (\psi(u), \psi(u)) + (w', w') \\
    &= (w, w) + (w', w') \\
    &= (v, v).
\end{align*}
    
因此 \(\omega\) 是酉算子 (正交算子). 显然这时 \(\varphi = {\omega \psi }\) .
\end{proof}


\begin{note}
    证明过程可以参考如下视频:
    \begin{itemize}
        \item \href{https://www.bilibili.com/video/BV1mJ411r7ZB?p=112&vd_source=53b67fca8cc409cd3c2da2368246ac2d}{https://www.bilibili.com/video/BV1mJ411r7ZB?p=112\&vd\_source=53b67fca8cc409cd3c2da2368246ac2d}22:21秒的视频讲解.
    \end{itemize}
\end{note}






我们称 \(\varphi = {\omega \psi }\) 是一个极分解. \(\varphi\) 也可作这样的分解: \(\varphi = {\psi }_{1}{\omega }_{1}\) ,这里 \({\omega }_{1}\) 为酉算子 (正交算子), \({\psi }_{1}\) 为半正定自伴随算子. 这个式子也称为极分解. 证明只需先对 \({\varphi }^{ * }\) 作如上述定理之极分解,再求 \({\varphi }^{ * }\) 的伴随即 \(\varphi\) 就可以了.


\begin{corollary}
    设 \(A\) 是 \(n\) 阶实矩阵,则存在 \(n\) 阶正交矩阵 \(\mathbf{Q}\) 以及 \(n\) 阶半正定实对称阵 \(\mathbf{S}\) ,使 \(A = \mathbf{Q}\mathbf{S}\) . 又设 \(B\) 是 \(n\) 阶复矩阵,则存在 \(n\) 阶酉矩阵 \(u\) 以及 \(n\) 阶半正定 Hermite 矩阵 \(\mathbf{H}\) ,使 \(B = u\mathbf{H}\) . 上述分解式当 \(A,B\) 为非异阵时被唯一确定.
\end{corollary}


实 (复) 矩阵的极分解也称为 \({OS}\) 分解 ( \({UH}\) 分解).



%%%%%%%%%%%-------奇异值分解
\section{奇异值分解}


\begin{definition}
    设 \(A\) 是 \(m \times n\) 实矩阵,如果存在非负实数 \(\sigma\) 以及 \(n\) 维非零实列向量 \(\alpha,m\) 维非零实列向量 \(\beta\) ,使

\[
A\alpha = \sigma \beta,{A}^{\prime }\beta = \sigma \alpha
\]

则称 \(\sigma\) 是 \(A\) 的奇异值, \(\alpha,\beta\) 分别称为 \(A\) 关于 \(\sigma\) 的右奇异向量与左奇异向量.
\end{definition}

为了从几何上描述奇异值问题, 我们引进线性映射的伴随概念, 它可以看成是内积空间上线性变换的伴随概念的推广.


\begin{definition}
    设 \(V,U\) 分别是 \(n\) 维, \(m\) 维欧氏空间, \(\varphi\) 是 \(V \rightarrow U\) 的线性映射. 若存在 \(U \rightarrow V\) 的线性映射 \({\varphi }^{ * }\) ,使得对任意的 \(v \in V,u \in U\) ,都有

\[
\left( {\varphi \left( v\right) ,u}\right) = \left( {v,{\varphi }^{ * }\left( u\right) }\right)
\]

成立,则称 \({\varphi }^{ * }\) 是 \(\varphi\) 的伴随
\end{definition}


\begin{theorem}
    设 \(V,U\) 分别是 \(n\) 维, \(m\) 维欧氏空间, \(\varphi\) 是 \(V \rightarrow U\) 的线性映射, 则 \(\varphi\) 的伴随 \({\varphi }^{ * }\) 存在且唯一.
\end{theorem}
\begin{proof}
    设$ V,U$的一组标准正交基分别为$ \{ e_{1},e_{2},\cdots ,e_{n}\}$,$ \{ f_{1},f_{2},\cdots ,f_{m}\}$,$ \varphi$在给定基下的表示矩阵为$ A$.

    任取$ v\in V,u\in U$,在给定基下的坐标向量分别为$ x,y$.则有 
    \[ (\varphi(v),u) = (Ax)'y = x'A'y, \]
    此时只需令$ \varphi^*$在给定两组标准正交基下的表示矩阵为$ A'$,即可得到 
    \[  (\varphi(v),u) = (Ax)'y = x'A'y = (v,\varphi^*(u)).\]
    于是$ \varphi^*$一定存在.
\end{proof}


\begin{definition}
    设 \(V,U\) 分别是 \(n\) 维, \(m\) 维欧氏空间, \(\varphi\) 是 \(V \rightarrow U\) 的线性映射,$ \varphi^*$是$ \varphi$的伴随.若存在非负数$ \sigma$,$ 0\neq v\in V,o\neq u\in U$使得 
    \[ \varphi(v) = \sigma u, \varphi^*(u) = \sigma v, \]
    则称 \(\sigma\) 是 \(\varphi\) 的奇异值, \(v\) 是 \(\sigma\) 关于 \(\varphi\) 的右奇异向量, \(u\) 是 \(\sigma\) 关于 \(\varphi\) 的左奇异向量. 
\end{definition}


从伴随的定义我们不难发现,若取定 \(V\) 的一组标准正交基 \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\} ,U\) 的一组标准正交基 \(\left\{ {{f}_{1},{f}_{2},\cdots ,{f}_{m}}\right\}\) ,设 \(\varphi \) 在这两组基下的表示矩阵为 \(A\) ,则 \({\varphi }^{ * }\) 在这两组基下的表示矩阵为 \({A}^{\prime }\) ,证明也和线性变换的情形相同. 因此,奇异值与奇异向量的几何定义即为下列等式成立:

\[
\varphi \left( v\right) = \sigma u,{\varphi }^{ * }\left( u\right) = \sigma v
\]

其中 \(\sigma \geq 0,v \in V,u \in U\) 都是非零向量. 不难验证 \({\varphi }^{ * }\varphi\) 是 \(V\) 上的半正定自伴随算子, \(\varphi {\varphi }^{ * }\) 是 \(U\) 上的半正定自伴随算子. 又

\[
{\varphi }^{ * }\varphi \left( v\right) = {\varphi }^{ * }\left( {\sigma u}\right) = \sigma {\varphi }^{ * }\left( u\right) = {\sigma }^{2}v
\]

因此 \({\sigma }^{2}\) 是 \({\varphi }^{ * }\varphi\) 的特征值, \(v\) 是 \({\varphi }^{ * }\varphi\) 的属于 \({\sigma }^{2}\) 的特征向量. 同理, \({\sigma }^{2}\) 也是 \(\varphi {\varphi }^{ * }\) 的特征值, \(u\) 是 \(\varphi {\varphi }^{ * }\) 的属于 \({\sigma }^{2}\) 的特征向量.



\begin{theorem}
    设 \(V,U\) 分别是 \(n\) 维, \(m\) 维欧氏空间, \(\varphi\) 是 \(V \rightarrow U\) 的线性映射, 则存在 \(V\) 和 \(U\) 的标准正交基,使 \(\varphi\) 在这两组基下的表示矩阵为
    \[ \begin{pmatrix}
        S & O \\ O & O 
    \end{pmatrix} \]
其中
\[ S = \begin{pmatrix}
    {\sigma }_{1} & & & \\ & {\sigma }_{2} & & \\ & & \ddots & \\ & & & {\sigma }_{r}
\end{pmatrix} \]
是一个 \(r\) 阶对角阵, \({\sigma }_{1} \geq {\sigma }_{2} \geq \cdots \geq {\sigma }_{r} > 0\) 是 \(\varphi\) 的非零奇异值.
\end{theorem}

\begin{proof}
    因为 \({\varphi }^{ * }\varphi\) 是 \(V\) 上的半正定自伴随算子,故存在 \(V\) 的一组标准正交基 \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}\) ,使 \({\varphi }^{ * }\varphi \) 在这组基下的表示矩阵为 \(n\) 阶对角阵 \(\operatorname{diag}\left\{ {{\lambda }_{1},\cdots ,{\lambda }_{r}}\right.\) , \(0,\cdots ,0\}\) ,其中 \(r = \mathrm{r}\left( {{\varphi }^{ * }\varphi }\right) = \mathrm{r}\left( \varphi \right)\) 且 \({\lambda }_{1} \geq \cdots \geq {\lambda }_{r} > 0\) 为 \({\varphi }^{ * }\varphi\) 的正特征值,从而有

\[
{\varphi }^{ * }\varphi \left( {e}_{i}\right) = {\lambda }_{i}{e}_{i},1 \leq i \leq r;{\varphi }^{ * }\varphi \left( {e}_{j}\right) = \mathbf{0},r + 1 \leq j \leq n.
\]

令 \({\sigma }_{i} = \sqrt{{\lambda }_{i}}\left( {i = 1,2,\cdots ,r}\right)\) 为算术平方根. 注意到对任意的 \(1 \leq i \leq r\) ,

\[
\parallel \varphi \left( {e}_{i}\right) {\parallel }^{2} = \left( {\varphi \left( {e}_{i}\right) ,\varphi \left( {e}_{i}\right) }\right) = \left( {{\varphi }^{ * }\varphi \left( {e}_{i}\right) ,{e}_{i}}\right) = {\lambda }_{i}\left( {{e}_{i},{e}_{i}}\right) = {\sigma }_{i}^{2}\parallel {e}_{i}{\parallel }^{2} = {\sigma }_{i}^{2},
\]

即 \(\begin{Vmatrix}{\varphi \left( {e}_{i}\right) }\end{Vmatrix} = {\sigma }_{i}\) ; 对任意的 \(1 \leq i \neq j \leq r\) ,

\[
\left( {\varphi \left( {e}_{i}\right) ,\varphi \left( {e}_{j}\right) }\right) = \left( {{\varphi }^{ * }\varphi \left( {e}_{i}\right) ,{e}_{j}}\right) = {\lambda }_{i}\left( {{e}_{i},{e}_{j}}\right) = 0
\]

又对任意的 \(r + 1 \leq j \leq n\) ,

\[
{\begin{Vmatrix}\varphi \left( {e}_{j}\right) \end{Vmatrix}}^{2} = \left( {\varphi \left( {e}_{j}\right) ,\varphi \left( {e}_{j}\right) }\right) = \left( {{\varphi }^{ * }\varphi \left( {e}_{j}\right) ,{e}_{j}}\right) = 0,
\]

即 \(\varphi \left( {e}_{j}\right) = \mathbf{0}\) . 令

\[
{f}_{i} = \frac{1}{{\sigma }_{i}}\varphi \left( {e}_{i}\right) ,i = 1,2,\cdots ,r
\]

则 \({f}_{1},{f}_{2},\cdots ,{f}_{r}\) 是 \(U\) 中一组两两正交的单位向量,由定理 9.2.2 可将它们扩张为 \(U\) 的一组标准正交基 \(\left\{ {{f}_{1},\cdots ,{f}_{r},{f}_{r + 1},\cdots ,{f}_{m}}\right\}\) . 于是在 \(V\) 的标准正交基 \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}\) 和 \(U\) 的标准正交基 \(\left\{ {{f}_{1},{f}_{2},\cdots ,{f}_{m}}\right\}\) 下, \(\varphi\) 满足:

\[
\varphi \left( {e}_{i}\right) = {\sigma }_{i}{f}_{i},1 \leq i \leq r;\varphi \left( {e}_{j}\right) = \mathbf{0},r + 1 \leq j \leq n.
\]

由 \({\varphi }^{ * }\) 在上述两组标准正交基下的表示矩阵是 \(\varphi\) 的表示矩阵的转置可得:

\[
{\varphi }^{ * }\left( {f}_{i}\right) = {\sigma }_{i}{e}_{i},1 \leq i \leq r;{\varphi }^{ * }\left( {f}_{j}\right) = \mathbf{0},r + 1 \leq j \leq m,
\]

这就得到了要证的结论.
\end{proof}


\begin{corollary}
    设 \(A\) 是 \(m \times n\) 阶实矩阵, \(A\) 的秩等于 \(r\) ,则存在 \(m\) 阶正交矩阵 \(P\) 以及 \(n\) 阶正交矩阵 \(\mathbf{Q}\) ,使

    \[
    {P}^{\prime }{AQ} = \left( \begin{array}{ll} S & O \\ O & O \end{array}\right)
    \]
    其中
    \[ S = \begin{pmatrix}
        {\sigma }_{1} & & & \\ & {\sigma }_{2} & & \\ & & \ddots & \\ & & & {\sigma }_{r}
    \end{pmatrix} \]
    是一个 \(r\) 阶对角阵, \({\sigma }_{1} \geq {\sigma }_{2} \geq \cdots \geq {\sigma }_{r} > 0\) 是 \(A\) 的非零奇异值.
\end{corollary}


\({P}^{\prime }{AQ} = \left( \begin{array}{ll} S & O \\ O & O \end{array}\right)\) 称为矩阵 \(A\) 的正交相抵标准型,而 \(A = P\left( \begin{array}{ll} S & O \\ O & O \end{array}\right) {Q}^{\prime }\) 则称为矩阵 \(A\) 的奇异值分解. 矩阵的奇异值分解在信息理论、控制理论等方面具有重要的应用.

如何计算 \(m \times n\) 阶实矩阵 \(A\) 的奇异值分解? 事实上,从上述定理的证明过程中可以得到具体的计算方法. 首先,求出 \({A}^{\prime }A\) 的正交相似标准型,即求出 \(n\) 阶正交矩阵 \(Q\) ,使

\[
{Q}^{\prime }{A}^{\prime }AQ = \operatorname{diag}\left\{ {{\lambda }_{1},\cdots ,{\lambda }_{r},0,\cdots ,0}\right\}
\]

其中 \(r = \mathrm{r}\left( {{A}^{\prime }A}\right) = \mathrm{r}\left( A\right)\) 且 \({\lambda }_{1} \geq \cdots \geq {\lambda }_{r} > 0\) 为 \({A}^{\prime }A\) 的正特征值. 其次, 设 \(Q = \left( {{\alpha}_{1},{\alpha}_{2},\cdots ,{\alpha}_{n}}\right)\) 为列分块,令

\[
{\sigma }_{i} = \sqrt{{\lambda }_{i}},{\beta}_{i} = \frac{1}{{\sigma }_{i}}A{\alpha}_{i},i = 1,2,\cdots ,r,
\]

则 \({\beta}_{1},{\beta}_{2},\cdots ,{\beta}_{r}\) 是两两正交长度为 1 的 \(m\) 维列向量,将它们扩张为 \({\mathbb{R}}_{m}\) 的一组标准正交基 \(\left\{ {{\beta}_{1},{\beta}_{2},\cdots ,{\beta}_{m}}\right\}\) . 最后,令 \(P = \left( {{\beta}_{1},{\beta}_{2},\cdots ,{\beta}_{m}}\right)\) 为 \(m\) 阶正交矩阵, 则

\[
{AQ} = P\left( \begin{array}{ll} S & O \\ O & O \end{array}\right)
\]

从而

\[
A = P\left( \begin{array}{ll} S & O \\ O & O \end{array}\right) {Q}^{\prime }
\]


即为 \(A\) 的奇异值分解.

在上述计算过程中,正交矩阵 \(Q\) 的选取并不唯一; 当 \(Q\) 取定之后,若 \(\mathrm{r}\left( A\right) =\) \(r < m\) ,则正交矩阵 \(P\) 的选取也不唯一. 因此在奇异值分解中,除了 \(\operatorname{diag}\{ S,\mathbf{O}\}\) (即矩阵 \(A\) 的奇异值) 是由 \(A\) 唯一确定之外,正交矩阵 \(P,Q\) 的选取一般都不唯一.





从 \(n\) 阶矩阵 \(A\) 的奇异值分解很容易得到 \(A\) 的极分解. 事实上,由 $ A = P\left( \begin{array}{ll} S & O \\ O & O \end{array}\right) {Q}^{\prime }$ 式可得:
\[
A = \left( {P{Q}^{\prime }}\right) Q\left( \begin{array}{ll} S & \mathbf{O} \\ \mathbf{O} & \mathbf{O} \end{array}\right) {Q}^{\prime }
\]
其中 \(R = P{Q}^{\prime }\) 是 \(n\) 阶正交矩阵, \(B = Q\operatorname{diag}\{ S,\mathbf{O}\} {Q}^{\prime }\) 是 \(n\) 阶半正定实对称阵, 从而 \(A = RB\) 即为 \(A\) 的极分解. 通过奇异值分解来求极分解,在处理奇异阵时很有用.



\fbox{SVD应用(Singular Value Decomposition)}

主成分分析(PCA).

$ A = P\left( \begin{array}{ll} S & O \\ O & O \end{array}\right) {Q}^{\prime }$,实际上是对$ \begin{pmatrix}
    S & O \\ O & O 
\end{pmatrix}$作了正交变换(即旋转),并不改变重要信息.


\begin{example}
    设 \(V,U\) 分别是 \(n\) 维, \(m\) 维欧氏空间, \(\varphi ,\psi\) 是 \(V \rightarrow U\) 的线性映射, \({\varphi }^{ * }\) 和 \({\psi }^{ * }\) 分别是 \(\varphi\) 和 \(\psi\) 的伴随. 若 \({\varphi }^{ * }\varphi = {\psi }^{ * }\psi\) ,证明: 存在 \(U\) 上的正交变换 \(\omega\) ,使 \(\varphi = {\omega \psi }\) .
\end{example}

\begin{solution}
   设在 \(V\) 的标准正交基 \(\left\{ {{e}_{1},{e}_{2}}\right.\) , \(\left. {\cdots ,{e}_{n}}\right\}\) 下, \({\varphi }^{ * }\varphi = {\psi }^{ * }\psi\) 的表示矩阵为 \(n\) 阶对角阵 \(\operatorname{diag}\left\{ {{\lambda }_{1},\cdots ,{\lambda }_{r},0,\cdots ,0}\right\}\) , 则由定理 9.9.2 的证明知存在 \(U\) 的标准正交基 \(\left\{ {{f}_{1},{f}_{2},\cdots ,{f}_{m}}\right\}\) ,使 \(\varphi\) 在这两组基下的表示矩阵为分块对角阵 \(\operatorname{diag}\{ S,\mathbf{O}\}\) . 同理,存在 \(U\) 的另一组标准正交基 \(\left\{ {{\mathbf{g}}_{1},{\mathbf{g}}_{2},\cdots ,{\mathbf{g}}_{m}}\right\}\) ,使 \(\psi\) 在 \(\left\{ {{e}_{1},{e}_{2},\cdots ,{e}_{n}}\right\}\) 和 \(\left\{ {{\mathbf{g}}_{1},{\mathbf{g}}_{2},\cdots ,{\mathbf{g}}_{m}}\right\}\) 下的表示矩阵也是 \(\operatorname{diag}\{ S,\mathbf{O}\}\) . 现定义 \(U\) 上的线性变换 \(\omega\) 为: \(\omega\left( {\mathbf{g}}_{i}\right) = {f}_{i},i = 1,2,\cdots ,m\) ,则 \(\omega\) 是 \(U\) 上的正交变换且

\[
{\omega \psi }\left( {e}_{i}\right) = \omega \left( {{\sigma }_{i}{\mathbf{g}}_{i}}\right) = {\sigma }_{i}\omega \left( {\mathbf{g}}_{i}\right) = {\sigma }_{i}{f}_{i} = \varphi \left( {e}_{i}\right) ,1 \leq i \leq r
\]

\[
\omega\mathbf{\psi }\left( {e}_{j}\right) = \omega\left( \mathbf{0}\right) = \mathbf{0} = \varphi \left( {e}_{j}\right) ,r + 1 \leq j \leq n,
\]
故 \(\varphi = {\omega \psi }\) .
\end{solution}



\begin{theorem}[广义逆]
    设 \(V,U\) 分别是 \(n\) 维, \(m\) 维欧氏空间, \(\varphi\) 是 \(V \rightarrow U\) 的线性映射,则存在唯一的线性映射$ \varphi^{\dagger}:U\rightarrow V$,满足:
    \begin{enumerate}[(1)]
        \item $ \varphi\varphi^{\dagger }\varphi = \varphi $;
        \item $ \varphi^{\dagger}\varphi\varphi^{\dagger} = \varphi^{\dagger}$;
        \item $ \varphi\varphi^{\dagger }$和$  \varphi^{\dagger}\varphi$都是自伴随算子,
    \end{enumerate}
    上述$ \varphi^{\dagger}$称为$ \varphi$的Moore-Penrose广义逆.
\end{theorem}













































